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前 H 


Internet 是 20 世纪 最 伟大 的 发 明之 一 ， 它 将 全 世界 数 以 千 万 计 的 计算 设备 〈 不 管 它们 
是 庞大 的 巨型 机 ， 还 是 桌面 上 的 个 人 电脑 ， 甚 至 是 人 们 口袋 中 的 移动 电话 ) 连接 成 一 个 巨 
大 的 网 络 ， 并 使 它们 能 够 在 彼此 之 间 迅 速 方便 地 传输 信息 。 整 个 世界 好 像 突然 变 小 了 ， 不 
同 地 区 的 人 与 人 之 间 的 距离 不 再 遥 不 可 及 。 然 而 ,改变 整个 世界 的 不 只 是 Internet 本 身 , 还 
有 无 法 计数 的 构筑 在 其 上 的 应 用 软件 。 通 过 电子 邮件 ， 信 件 的 往来 不 再 需要 几 天 甚至 几 周 
T: 通过 网 上 商城 ， 在 家 就 可 以 购物 ， 视 频 点 播 让 人 们 可 以 在 家 中 欣赏 喜爱 的 电影 。 如 果 
没有 这 些 应 用 ，Internet 至 今 还 仅仅 是 科研 人 员 实 验 室 里 使 用 的 科研 工具 。 

正如 Internet 的 核心 TCP/IP 协议 的 目标 所 指出 的 ， 任 何人 都 可 以 方便 地 使 用 Internet, 
并 在 其 上 开发 出 新 的 应 用 。 当 然 , 要 开发 基于 Internet 上 的 应 用 必须 先知 道 它 是 如 何 工 作 的 ， 
即 它 是 如 何 将 各 种 不 同 的 设备 连接 起 来 的 ， 如 何 将 数据 从 一 个 计算 设备 传输 到 另 一 个 的 ， 
是 如 何 支 撑 各 种 各 样 的 应 用 软件 的 。 当 然 ， 如 果 你 的 工作 不 需要 知道 这 些 ， 如 果 你 对 此 不 
感 兴趣 ， 那 就 可 以 合 上 这 本 书 了 。 但 如 果 你 是 一 个 程序 员 ， 或 者 你 想 成 为 他 们 中 的 一 员 ， 
如 果 你 正在 开发 一 个 网 络 软件 ， 你 开发 的 软件 的 客户 端 或 服务 器 端 在 局 域 网 工作 正常 但 在 
广域网 中 却 总 出 问题 ， 或 者 它们 的 效率 总 达 不 到 要 求 ， 如 果 你 是 所 在 单位 的 网 络 管理 员 ， 
那么 本 书 将 会 对 你 有 所 帮助 。 

司机 虽然 不 用 生产 自己 开 的 汽车 ， 但 一 个 好 的 司机 应 该 知道 汽车 的 工作 原理 。 同 样 ， 
网 络 软件 开发 人 员 不 用 自己 设计 通信 网 络 的 协议 , 但 应 该 知道 网 络 协议 的 工作 原理 和 机 制 ， 
这 样 才能 开发 出 正确 、 稳 定 、 高 效 的 网 络 软件 。 本 书 的 目的 是 帮助 读者 提高 对 Internet 的 理 
解 和 网 络 编程 能 力 。 为 达到 这 个 目的 ， 本 书 从 Internet 的 工作 原理 TCP/IP 协议 族 和 实际 的 
编程 模式 和 技巧 两 个 方面 进行 了 介绍 。 

本 书 由 两 部 分 组 成 : 

第 1 部 分 由 1~16 章 组 成 ， 介 绍 了 TCP/IP 协议 族 的 体系 结构 及 各 层 组 成 协议 的 工作 机 
制 。 这 部 分 介绍 的 各 种 协议 是 网 络 编程 中 常见 的 需要 了 解 的 协议 ， 对 它们 的 理解 有 助 于 理 
解 各 种 网 络 编程 技术 。 第 1 章 介绍 了 Internet 的 发 展 历史 、 现 状 及 发 展 趋势 ;第 2 章 对 TCP/IP 
协议 族 总 体 的 体系 结构 进行 了 系统 的 说 明 ; 第 3~7 章 介绍 网 络 层 中 的 部 分 重要 协议 ， 其 中 
重点 是 作为 TCP/IP 核心 的 下 协议; 第 8 章 和 第 9 章 分 别 介 绍 了 传输 层 的 两 个 协议 : UDP 
和 TCP; 第 10-14 章 介绍 几 种 常见 的 应 用 层 协议 ， 包 括 远程 登录 、 电 子 邮件 、HTTP 协议 、 
网 络 文件 和 网 络 管理 等 ， 第 15 章 对 下 一 代 IP 协议 即 IPv6 进行 了 介绍 ; 第 16 章 则 简单 介 
绍 了 常见 操作 系统 (Windows, UNIX/Linux) 中 的 TCP/IP 协议 的 实现 机 制 。 

第 2 部 分 由 17-22 章 组 成 ， 介 绍 了 网 络 编程 的 接口 、 模 式 和 技巧 。 第 17 章 和 19 章 详 
细 介 绍 了 Windows 中 的 网 络 编程 接口 Socket 及 使 用 ; 第 18 章 、 第 20 SERI 21 章 介绍 客户 
端 /服务 器 的 网 络 编程 模型 ， 并 重点 介绍 了 服务 器 端 编程 经 常 使 用 的 技术 ， 第 22 章 通过 对 
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一 个 完整 的 Web 服务 器 程序 的 分 析 ， 进 一 步 说 明了 这 部 分 各 章 中 介绍 的 各 种 编程 技术 。 
通过 对 各 种 协议 工作 机 制 的 了 解 ， 并 使 用 试验 验证 各 种 网 络 编程 技术 ， 理 论 和 实践 紧 
密 结合 , 相信 读者 对 Internet 的 理解 和 编程 能 力 都 能 在 较 短 时 间 内 得 到 提高 。 如 果 本 书 确实 
能 够 为 读者 提供 帮助 ， 那 将 是 我 们 最 大 的 荣幸 。 
由 于 时 间 仓 促 ， 加 之 作者 水 平 有 限 ， 书 中 难免 会 有 不 足 之 处 ， 真 诚 欢迎 各 位 读者 予以 
批评 指正 。 
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什么 是 Intemet? 在 英语 中 “Inter” 的 含义 是 “交互 的 ”，“net” 是 指 “ 网 络 ”。 简 单 
而 言 , Internet 是 指 一 个 由 计算 机 构成 的 交互 网 络 。 它 是 一 个 世界 范围 内 的 巨大 的 计算 机 网 络 
体系 ， 它 把 全 球 数 万 个 计算 机 网 络 ， 数 千 万 台 主 机 连接 起 来 ， 包 含 了 难以 计数 的 信息 资源 ， 
向 全 世界 提供 信息 服务 。 它 的 出 现 ， 是 世界 由 工业 化 走向 信息 化 的 必然 和 象征 ， 但 这 并 不 是 
对 Internet 的 一 种 定义 ， 而 仅仅 是 对 它 的 一 种 解释 。 从 网 络 通信 的 角度 来 看 ，Internet 是 一 个 
以 TCP/IP 网 络 协议 连接 各 个 国家 、 各 个 地 区 、 各 个 机 构 的 计算 机 网 络 的 数据 通信 网 。 从 信 
息 资源 的 角度 来 看 ，Internet 是 一 个 集 各 个 部 门 、 各 个 领域 的 各 种 信息 资源 为 一 体 ， 供 网 上 用 
户 共 享 的 信息 资源 网 。 现 在 的 Intemet 已 经 远 远 超过 了 一 个 网 络 的 涵义 ， 它 是 一 个 信息 社会 
的 缩影 。 虽 然 至 今 还 没有 一 个 准确 的 定义 来 概括 Internet, 但 是 这 个 定义 应 从 通信 协议 、 物 理 
连接 、 资 源 共 享 、 相 互联 系 、 相 互通 信 等 角度 来 综合 加 以 考虑 。 

了 解 一 个 事物 的 最 有 效 方法 莫 过 于 先 了 解 它 的 历史 , 在 本 章 中 , 先 简要 回顾 一 下 Internet 
的 发 展 历史 , 再 介绍 与 Internet 相关 的 管理 结构 ， 并 对 当前 的 Internet 应 用 现状 与 发 展 趋势 作 
一 简单 介绍 。 


1.1 Internet 发 展 历史 


Internet 最 早 来 源 于 美国 国防 部 高 级 研究 计划 局 DARPA (Defense advanced Research 
Projects Agency) 的 前 身 ARPA 建立 的 ARPAnet， 该 网 于 1969 年 投入 使 用 。 从 20 世纪 60 
年 代 开始 ，ARPA 就 开始 向 美国 国内 大 学 的 计算 机 系 和 一 些 公司 提供 经 费 ， 以 促进 基于 分 组 
交换 技术 的 计算 机 网 络 的 研究 。1968 年 ，ARPA 为 ARPAnet 网 络 项 目 立 项 ， 该 项 目 基于 这 
样 一 种 主导 思想 网络 必 须 能 够 经 受 住 故障 的 考验 而 维持 正常 工作 ， 一 旦 发 生 战争 ， 当 网 络 
的 某 一 部 分 因 遭 受 攻击 而 失去 工作 能 力 时 ， 网 络 的 其 他 部 分 应 当 能 够 维持 正常 通信 。 最 初 ， 
ARPAnet 主要 用 于 军事 研究 目的 ， 它 有 五 大 特点 : 

(1) 支持 资源 共享 。 

(2) 采用 分 布 式 控制 技术 。 
(3) 采用 分 组 交换 技术 。 

(4) 使 用 通信 控制 处 理 机 。 
(5) 采用 分 层 的 网 络 通 信 协 议 。 

1969 年 6 月 ， 完 成 第 一 阶段 的 工作 ， 组 成 了 4 个 结 点 的 试验 性 网 络 ， 称 为 ARPAnet。 
ARPAnet 采用 称 之 为 接口 报 文 处 理 器 CIMP) 的 小 型 机 作为 网 络 的 结 点 机 ， 为 了 保证 网 络 的 
可 靠 性 , 每 个 IMP 至 少 和 其 他 两 个 IMP 通过 专线 连接 , 主机 则 通过 IMP 接 入 ARPAnet. IMP 
之 间 的 信息 传输 采用 分 组 交换 技术 ， 并 向 用 户 提供 电子 邮件 、 文 件 传送 和 远程 登录 等 服务 。 
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ARPAnet 被 公认 为 世界 上 第 一 个 采用 分 组 交换 技术 组 建 的 网 络 。 

1972 年 ，ARPAnet 在 首届 计算 机 后 台 通 信 国 际会 议 上 首次 与 公众 见面 ， 并 验证 了 分 组 
交换 技术 的 可 行 性 ， 由 此 ，ARPAnet 成 为 现代 计算 机 网 络 诞生 的 标志 。 

1973 ££, 美国 国防 部 高 级 研究 计划 局 DARPA 正式 启动 并 实施 了 一 研究 项 目 , 称 为 “The 
Internetting Project”。 该 项 目 着 眼 于 互联 各 种 基于 分 组 交换 技术 的 计算 机 网 络 ， 并 设计 出 一 
类 通信 协议 以 便于 在 网 络 计算 机 中 透明 地 交互 。 由 该 项 目 构建 的 网 络 可 视 为 现在 Internet 的 
前 身 ， 其 所 研发 的 通信 协议 最 终 发 展 成 为 著名 的 TCP/IP 协议 族 。 

1980 年 ，ARPA 投资 把 TCP/IP 加 进 UNIX (BSD4.1 版 本 ) 的 内 核 中 ， 在 BSD4.2 版 本 
Ua, TCP/IP 协议 即 成 为 UNIX 操作 系统 的 标准 通信 模块 ， 这 其 中 美国 国防 部 的 作用 功 不 可 
没 。 

1982 f£, Internet 由 ARPAnet, MILNET 等 几 个 计算 机 网 络 合并 而 成 ， 作 为 Intemet 的 
早期 骨干 网 ，ARPAnet 试验 并 奠定 了 Internet 存在 和 发 展 的 基础 ， 较 好 地 解决 了 异种 机 网 络 
互联 的 一 系列 理论 和 技术 问题 。 

1983 年 ，ARPAnet 分 裂 为 两 部 分 : ARPAnet 和 纯 军事 用 的 MILNET。 该 年 1 月 ，ARPA 
把 TCP/IP 协议 作为 ARPAnet 的 标准 协议 。 其 后 ， 人 们 称呼 这 个 以 ARPAnet 为 主干 网 的 网 际 
互联 网 为 nternet，TCP/P 协议 族 便 在 Internet 中 进行 研究 、 试 验 ， 并 改进 成 为 使 用 方便 、 效 
率 极 好 的 协议 族 。 

1986 年 ， 美 国 国家 科学 基金 会 NSF (National Science Foundation) 建立 了 6 大 超级 计算 
机 中 心 ， 为 了 使 全 国 的 科学 家 、 工 程 师 能 够 共享 这 些 超 级 计算 机 设施 ，NSF 建立 了 自己 的 基 
于 TCP/IP 协议 族 的 计算 机 网 络 NSFnet. NSF 在 全 国 建立 了 按 地 区 划分 的 计算 机 广域网 ， 并 
将 这 些 地 区 网 络 和 超级 计算 中 心 相连 ， 最 后 将 各 超级 计算 中 心 互联 起 来 。 地 区 网 的 构成 一 般 
是 由 一 批 在 地 理 上 局 限于 某 一 地 域 ， 在 管理 上 隶属 于 某 一 机 构 或 在 经 济 上 有 共同 利益 的 用 户 
的 计算 机 互联 而 成 。 连 接 各 地 区 网 上 主 通 信 结 点 计算 机 的 高 速 数据 专线 构成 了 NSFnet 的 主 
干 网 ， 这 样 ， 当 一 个 用 户 的 计算 机 与 某 一 地 区 相连 以 后 ， 它 除了 可 以 使 用 任 一 超级 计算 中 心 
的 设施 ， 可 以 同 网 上 任 一 用 户 通信 外 ， 还 可 以 获得 网 络 提供 的 大 量 信 息 和 数据 。 这 一 成 功 使 
得 NSFnet 于 1990 年 6 月 彻底 取代 了 ARPAnet 而 成 为 Internet 的 主干 网 。 

到 了 20 世纪 90 年 代 ， 美 国政 府 意识 到 仅 靠 政 府 资助 ， 难 以 适应 应 用 的 发 展 需求 ， 故 鼓 
励 商业 部 门 介入 。MCI、IBM 和 MERIT 公司 联合 组 建 ANS 高 级 网 络 和 服务 公司 ) ， 建 立 
覆盖 全 美的 、T3 (44.746M) 的 ANSNET， 连 接 ARPANET 和 NSFNET。 随 后 ，DARPA 和 
NSF 撤销 对 ARPAnet, NSFNET 的 资助 , 因特网 开始 商用 。 商 业 机 构 的 介入 , 出 现 大 量 的 ISP 
和 ICP， 丰 富 了 Internet 的 服务 和 内 容 。 美 国政 府 通 过 因特网 发 布 世界 各 国 的 经 济 、 贸 易 信 
息 。 

Internet 的 发 展 时 间 表 如 图 1.1 所 示 ， 图 中 给 出 了 在 Internet 发 展 中 涉及 到 的 重大 事件 。 


1.2 Internet 管理 机 构 


Internet 的 发 展 和 正常 运转 需要 一 些 管理 机 构 的 管理 , 如 了 P 地 址 的 分 配 需要 有 IP 地 址 资 
源 的 管理 机 构 ， 各 种 标准 的 形成 需要 有 专门 的 技术 管理 机 构 。 本 节 将 介绍 Intemet 各 个 管理 
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机 构 的 职能 及 它们 之 间 的 关系 。 


INTERNET INTERNET Pren 
ARPANET | > p p 早期 骨干 网 | JE M » 
DOE 1980 年 1986 年 1993 年 
MEUM APARNET 过 NSF 骨干 网 NSF net 取 代 World Wid 
um A 滤 到 TCP/IP A 启动 APARNET “a 


研究 出 ICP/IP 


图 1.1 Internet 发 展 时 间 表 


1.2.1 Internet 管理 机 构 


Internet 工作 委员 会 (Internet Activities Board, IAB) RF 1980 年 ， 属 于 非 营利 机 构 ， 
负责 技术 的 方针 和 策略 的 拟定 ， 以 及 管理 工作 的 导 引 协调 ， 例 如 有 关 TCP/IP 的 发 展 、 决 定 
哪些 协议 能 成 为 TCP/IP 的 一 员 、 在 何 时 可 以 成 为 标准 ， 以 及 因特网 的 演进 、 网 络 系统 与 通 
信 技 术 的 研发 等 工作 。 在 IAB 之 下 ， 有 研究 小 组 及 工作 小 组 两 个 主要 单位 ， 并 有 一 些小 型 指 
导 群 ， 共 同 进行 设 定 标准 及 决定 策略 的 工作 。IAB 的 组 织 架构 可 用 图 1.2 来 说 明 。 
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IRSG 研究 指导 组 IESG 指导 组 
(Internet Research Steering Group) (Internet Engineering Steering Group) 
IRTF 研究 任务 小 组 IETF 工程 任务 小 组 
(Internet Research Task Force) (Internet Engineering Task Force) 


12 IAB 的 组 织 架 构图 


1.2.2 Internet 域名 与 地 址 管理 机 构 


Internet 域名 与 地 址 管理 机 构 CICANN) 是 为 承担 域名 系统 管理 、IP 地 址 分 配 、 协 议 参 
数 配置 以 及 主 服务 器 系统 管理 等 职能 而 设立 的 非 营 利 机 构 。 现 由 IANA 和 其 他 实体 与 美国 政 
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府 约定 进行 管理 .ICANN 理事 会 是 ICANN 的 核心 权力 机 构 , 共 由 19 位 理事 组 成 :9 位 At-Large 
理事 ，9 位 来 自 ICANN 3 家 支持 组 织 提名 的 理事 每 家 3 名 ) 和 一 位 总 裁 。 根 据 ICANN 的 章 
程 规 定 ， 它 设立 3 个 支持 组 织 ， 从 3 个 不 同方 面 对 Internet 政策 和 构造 进行 协助 、 检 查 以 及 
提出 建议 。 这 些 支持 组 织 帮助 促进 了 Internet 政策 的 发 展 ， 并 且 在 Intemet 技术 管理 上 鼓励 多 
样 化 和 国际 参与 。 每 家 支持 组 织 向 ICANN 董事 会 委派 3 位 董事 。 这 3 个 支持 组 织 是 : 

CD 地 址 支持 组 织 (CASO) ， 负 责 IP 地 址 系统 的 管理 。 

(2) 域名 支持 组 织 DNSO) ， 负 责 互 联网 上 的 域名 系统 (DNS) 的 管理 。 

G) 协议 支持 组 织 (PSO) ， 负 责 涉及 Internet 协议 的 惟一 参数 的 分 配 。 此 协议 是 允许 
计算 机 在 因特网 上 相互 交换 信息 ， 管 理 通信 的 技术 标准 。 


1.2.3 IP 地 址 管理 机 构 


全 世界 国际 性 的 IP 地 址 管理 机 构 有 4 个 ， 即 ARIN、RIPE、APNIC 和 LACNIC， 它 们 
负责 IP 地 址 的 地 理 区 域 ， 如 图 1.3 所 示 。 
其 中 美国 mtemet 号 码 注册 中 心 ARIN 
(American Registry for Internet Numbers) 
提供 的 查询 内 容 包括 了 全 世界 早期 网 络 及 
现在 的 美国 、 加 拿 大 、 撤 哈 拉 沙漠 以 南非 洲 cs 
的 下 地 址 信息 ;欧洲 他 地 址 注册 中 心 RIPE ; 
(Reséaux IP Européens) 包 括 了 欧洲 、 北 非 、 》 
LACNIC 


Regional Internet Registries 


西亚 地 区 的 他 地 址 信息 ; 亚太 地 区 网 络 信息 
中 心 APNIC(Asia Pacific Network Information 
Center) 包括 了 东亚 、 南 亚 、 大 洋 洲 人 P 地 址 13 IP 地 址 管理 机 构 覆 盖 范 围 图 
注册 信息 ; 拉丁 美洲 及 加 勒 比 互联 网 络 信息 

中 心 LACNIC (Latin American and Caribbean Network Information Center) 包括 了 拉丁 美洲 及 
加 勒 比 海 诸 岛 卫 地 址 信息 。 

中 国 的 IP 地 址 管理 机 构 称 为 中 国 互 联网 络 信息 中 心 (China Internet Network Information 
Center， 简 称 CNNIC) ， 它 是 成 立 于 1997 年 6 月 的 非 营 利 管理 与 服务 机 构 ， 行 使 国家 互联 
网 络 信息 中 心 的 职责 。 中 国 科 学 院 计 算 机 网 络 信息 中 心 承担 CNNIC 的 运行 和 管理 工作 。 它 
的 主要 职责 包括 域名 注册 管理 ，IP 地 址 、AS 号 分 配 与 管理 ， 目 录 数 据 库 服务 ， 互 联网 寻 址 
技术 研发 ， 互 联网 调查 与 相关 信息 服务 ， 国 际 交流 与 政策 调研 ， 承 担 中 国 互联 网 协会 政策 与 
资源 工作 委员 会 秘书 处 的 工作 。 


1.3 Internet 协议 与 标准 


Internet 的 实质 是 实现 异种 网 络 的 互联 , 它 充分 利用 各 种 通信 子 网 的 数据 传输 能 力 , 通过 
在 依赖 于 通信 子 网 的 通信 模块 和 应 用 程序 之 间 插 入 新 的 协议 软件 来 保证 应 用 程序 之 间 的 互 
操作 性 。 因 特 网 的 协议 族 称 为 TCP/IP 协议 族 。 其 中 包含 了 为 数 众多 的 协议 ， 如 应 用 层 的 
Telnet, FTP, HTTP. SMTP. DNS 等 协议 、 传 输 层 TCP. UDP 协议 ， 网 络 层 的 全 、ARP、 
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RARP、ICMP、IGMP 等 协议 。 

Internet 的 一 个 公认 标准 是 RFC(Request For Comment), RFC 可 以 说 是 TCP/IP 和 Internet 
发 展 及 成 长 的 基石 ， 所 有 关于 TCP/IP 和 因特网 的 规格 、 协 议 内 容 、 会 议 记录 、 发 展 历史 等 
文件 数据 都 以 RFC 数字 编号 的 方式 , 由 美国 网 络 信 息 中 心 (Network Information Center, NIC) 
所 收集 。 例 如 RFC1000 介绍 了 一 些 RFC 的 历史 ， 以 及 各 种 RFC 的 分 类 。 若 有 人 对 于 改进 
TCP/IP 现 有 能 力 有 新 的 想法 时 ， 可 以 写 一 个 计划 方案 发 表 在 Internet 上 ， 这 个 计划 方案 即 是 
所 谓 的 RFC。RFC 的 作者 都 是 自愿 的 ， 其 创作 得 不 到 任何 报 偿 。 每 个 REC 会 被 赋予 一 个 号 
码 ， 此 号 码 为 一 递增 的 数字 ， 绝 不 会 被 重新 指定 。 更 新 的 RFC 有 更 高 的 数字 编号 ， 并 使 得 旧 
的 REC 失效 ， 因 此 若 发 现在 不 同 的 文件 中 讨论 的 是 相同 的 主题 ， 应 以 编号 较 高 的 RFC 为 依 
Hh. 另外, 亦 可 能 有 自愿 的 评论 者 对 REC 作 建 设 性 的 批评 与 建议 , 原作 者 可 根据 以 校订 原先 
的 设计 使 之 更 加 完美 。 若 一 切 无 问题 ， 该 项 RFC 便 成 为 起 草 标准 (Draft Standard) ， 程 序 设 
计 人 员 就 可 依 该 份 标准 来 设计 软件 , 实现 其 所 描述 的 功能 。 在 真正 的 程序 代码 出 现 之 前 , RFC 
都 不 被 认定 是 正式 标准 。 


14 Internet 应 用 现状 与 发 展 趋势 


从 目前 的 情况 来 看 , Internet 市 场 仍 具 有 巨大 的 发 展 潜力 , 未 来 其 应 用 将 涵盖 从 办 公 室 共 
享 信息 到 市 场 营销 、 服 务 等 广泛 领域 。 另 外 ，Internet 带 来 的 电子 贸易 正 改变 着 现今 商业 活动 
的 传统 模式 ， 其 提供 的 方便 而 广泛 的 互联 必 将 对 未 来 社会 生活 的 各 个 方面 带 来 影响 。 

然而 Intemet 也 有 其 固有 的 缺点 ， 如 接 入 网 络 缺 乏 整体 规划 和 设计 ， 网 络 拓扑 结构 不 清 
晰 以 及 容错 及 可 靠 性 能 的 缺乏 ， 而 这 些 对 于 商业 领域 的 不 少 应 用 是 至 关 重 要 的 。 安 全 性 问题 
是 困扰 Internet 用 户 发 展 的 另 一 主要 因素 。 虽 然 现 在 已 有 不 少 的 方案 和 协议 来 确保 Internet 
网 上 的 联机 商业 交易 的 可 靠 进 行 ， 但 真正 适用 并 将 主宰 市 场 的 技术 和 产品 目前 尚 不 明确 。 另 
db, Internet 是 一 个 中 心 的 网 络 。 所 有 这 些 问题 都 在 一 定 程度 上 阻碍 了 Intenet WAKE, RA 
解决 了 这 些 问 题 ，Intemet 才能 更 好 地 发 展 。 

随 着 世界 各 国信 息 高 速 公路 计划 的 实施 , Internet 主干 网 的 通信 速度 将 大 幅度 提高 ;有 线 、 
无 线 等 多 种 通信 方式 将 更 加 广泛 、 有 效 地 融 为 一 体 ; Intemet 的 商业 化 应 用 将 大 量 增加 ， 商 业 
应 用 的 范围 也 将 不 断 扩大 ; Internet 的 覆盖 范围 、 用 户 入 网 数 以 令 人 难以 置信 的 速度 发 展 ; 
Internet 的 管理 与 技术 将 进一步 规范 化 ,其 使 用 规范 和 相应 的 法 律 规范 正 逐 步 健 全 和 完善 ; 网 
络 技 术 不 断 发 展 ， 用 户 界面 更 加 友好 ; 各 种 令 人 耳目 一 新 的 使 用 方法 不 断 推出 ， 最 新 的 发 展 
包括 实时 图 像 和 话音 的 传输 ， 网 络 资源 急剧 膨胀 。 总 之 ， 人 类 社会 必 将 更 加 依赖 mternet， 人 
们 的 生活 方式 将 因此 而 发 生根 本 的 改变 。 


第 2 音 TCP/IP 协议 族 体系 结构 


TCPAP 协议 族 无 疑 是 当今 流行 最 为 广泛 的 网 络 互联 协议 ， 人 们 今天 所 熟悉 的 绝 大 多 数 
Internet 服务 都 是 架构 在 该 协议 族 之 上 的 , 对 于 它 的 历史 已 在 第 1 章 中 有 所 了 解 。 那么 它 究竟 
是 如 何 将 运行 不 同 操作 系统 ， 由 不 同 厂家 生产 的 计算 机 互联 起 来 的 ? 它 和 已 有 的 OSI 模型 之 
间 的 关系 如 何 ? 它 的 每 一 层 具 体 包含 哪些 协议 ? 我 们 将 在 本 章 中 一 一 阐述 。 


24 TCP/IP 层次 结构 及 其 与 OSI 七 层 体 系 结构 的 比较 


TCP/IP 与 OSI 的 体系 结构 都 是 采用 分 层 结构 , 结构 中 的 下 层 向 上 层 提供 服务 。 这 种 分 层 
结构 具有 模块 划分 清晰 ， 扩 展 性 好 等 优点 ， 所 以 被 TCP/IP 和 OSI 所 采用 。 虽 然 TCP/IP 和 
OSI 都 是 采用 分 层 结构 ， 它 们 之 间 还 是 存在 着 许多 重要 的 区 别 。 


2.1.1 分 层 体系 结构 的 对 应 


TCP/IP 与 OSI 分 层 架构 间 的 对 应 ， 可 以 用 图 2.1 来 表示 。OSI 具有 完整 的 七 层 架 构 ， 而 
TCP/IP 则 只 定义 了 3 种 层次 的 服务 。TCP/IP 应 用 服务 层 ， 对 应 到 OSI 架构 中 的 应 用 层 、 表 示 
层 以 及 会 话 层 。 两 者 之 间 最 大 的 不 同 点 在 于 : OSI 考虑 到 开放 式 系统 互联 而 设 定 了 数据 表示 层 ， 
TI TCP/IP 的 网 络 层 与 传输 层 , 则 分 别 与 OSI 的 网 络 层 和 传输 层 的 功能 大 致 相同 。 此 外 , TCP/IP 
本 身 并 没有 提供 物理 层 与 数据 链 路 层 的 服务 ， 所 以 一 般 是 架 在 OSI 的 第 一 、 二 层 上 运作 。 


OSI TCP/IP 
应 用 层 
表示 层 应 用 层 
会 话 层 
传输 层 传输 层 
网 络 层 Internet 层 
数据 链 路 层 
van 网 络 接口 层 
图 2.1 TCP/IP 与 OSI 分 层 结构 的 对 应 
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TCP/IP 的 发 展 比 OSI 早 了 约 10 年 左右 ， 技 术 上 的 发 展 较 成 熟 ， 开 发 出 来 的 相关 应 用 协 


第 2 章 TCP/IP 协议 族 体系 结构 


议 也 较 多 ， 此 外 ， 由 于 它 是 应 因特网 的 实际 需求 而 产生 的 ， 因 此 在 现实 的 环境 中 可 行 性 也 较 
高 。 而 OSI 架构 完整 、 功 能 详尽 、 包 容 性 大 ， 但 在 Internet 中 大 多 数 还 属于 测试 阶段 ， 很 少 
有 实际 运行 的 系统 。 

就 目前 的 发 展 状况 来 说 ，TCP/P 已 成 为 了 Intemet 中 的 主流 协议 , 在 使 用 上 比 OSI 要 广 
泛 许 多 。 它 具有 非常 多 的 应 用 标准 ， 对 于 现行 网 络 应 用 系统 的 开发 而 言 ， 能 提供 较 多 的 规划 
选择 ， 而 且 由 于 TCP/IP 已 在 实际 中 使 用 相当 长 的 时 间 ， 具 有 此 方面 开发 与 使 用 经 验 的 人 员 
也 比较 多 。 


2.1.3 ”标准 及 规范 


TCP/IP 产生 于 Internet 的 研究 和 实践 中 ， 是 应 实际 需求 而 产生 的 实 作 ， 本 身 在 发 展 之 前 
并 没有 事先 定义 一 个 严谨 的 架构 。 而 OSI 则 是 由 标准 化 组 织 所 制定 ， 先 定义 了 一 个 功能 完整 
的 架构 ， 再 根据 该 架构 发 展 相应 的 协议 。 

TCP/IP 虽然 有 IAB, IETF 等 机 构 负责 制定 与 讨论 TCP/IP 的 标准 化 ， 也 有 许多 学 术 界 人 
士 和 计算 机 厂商 参与 ， 但 是 却 没有 一 个 正式 的 单位 负责 测试 验证 厂商 所 开发 的 TCP/IP 通信 
软件 是 否 完全 遵照 标准 的 规范 设计 ， 所 以 对 使 用 者 而 言 ， 惟 一 的 保障 是 借 着 各 系统 之 间 的 互 
连 互通 测试 经 验 ， 以 确实 证 明 其 所 使 用 的 网 络 系统 是 否 可 以 与 其 他 系统 上 的 TCP/IP 网 络 应 
用 功能 互通 。 而 OSI 则 有 专门 的 单位 来 进行 规范 性 测试 以 及 互通 性 测试 ， 这 一 点 对 使 用 者 而 
言 ， 是 一 个 很 重要 的 保障 ， 但 是 由 于 测试 通常 需 花 费 一 段 不 短 的 时 间 ( 约 需 二 至 三 年 ) Br 
以 一 般 效率 不 高 ， 经 常 出 现 的 情况 是 标准 已 经 出 来 ， 但 是 却 在 市 场 上 找 不 到 可 用 产品 ， 与 市 
场 需求 不 太 相符 。 


2.14 WBE 


TCP/IP 的 网 络 层 与 OSI 架构 中 的 网 络 层 的 功能 大 致 相仿 。 若 以 实际 协议 来 做 比较 , TCP/IP 
ft IP 45 OSI 的 CLNP (Connectionless Network Protocol) ， 其 主要 差别 在 于 寻 址 方式 的 不 同 。 
TCP/IP 将 网 络 上 每 一 点 的 地 址 定 为 32 位 的 固定 长 度 ，TCP/IP 网 络 上 的 每 一 个 系统 都 至 少 具 有 
一 个 惟一 的 地 址 与 其 他 系统 通信 , 但 对 于 同时 提供 两 个 网 络 接口 连接 不 同 网 络 的 系统 (如 网 关 ) 

言 ， 则 必须 拥有 两 个 以 上 的 地 址 ， 这 在 网 络 地 址 管理 及 对 网 络 其 他 点 的 通信 进行 上 ， 则 显得 
较为 麻烦 。 而 且 以 长 远 的 角度 来 看 ， 现 有 的 寻 址 方式 将 不 能 容纳 网 络 上 愈 来 愈 多 新 增 的 系统 ， 
因此 ， 目 前 许多 人 员 正 在 研究 IPv6 这 一 新 协议 ， 以 满足 未 来 不 断 扩展 的 需求 。 

OSI 所 定 的 地 址 空间 为 不 固定 的 可 变 长 ， 必 须 由 所 选 定 的 地 址 命名 方式 CAuthority and 
Identifier) 决定 ， 最 长 可 达 160 位 (20 bytes) 。 依 照 OSI 中 有 关 地 址 标准 的 规范 ， 网 络 上 每 
一 个 系统 至 多 可 有 256 个 通信 地 址 ， 而 且 因为 OSI 所 定义 的 网 络 地 址 与 网 络 接口 无 关 ， 所 以 
网 络 地 址 的 安排 将 不 受 限 于 网 络 接口 。 由 于 其 地 址 长 度 较 长 ， 因 此 将 可 容纳 网 络 上 更 多 的 系 
统 ， 具 有 较 大 的 增长 空间 。 


2.1.5 ”传输 层 
TCP/IP 在 传输 层 中 有 TCP 与 UDP 两 种 协议 ， 各 具有 面向 连接 与 无 连接 的 性 质 。OSI 在 


TCP/IP 协议 及 网 络 编程 技术 


制定 传输 层 的 标准 时 ， 主 要 是 参考 TCP/IP 协议 族 ， 而 定义 了 五 个 等 级 的 不 同 层次 服务 。 其 
中 TCP/IP 的 TCP 与 OSI 的 TP4、TCP/IP 的 UDP 与 OSI 的 TP0 的 架构 及 功能 大 体 上 是 相同 
的 ， 只 是 其 内 部 细节 有 一 些 差异 。 


2.16 MAB 


应 用 层 的 功能 应 该 是 面向 最 终 用 户 的 , 因此 它们 是 千差万别 的 。 常见 的 应 用 有 以 下 几 种 : 
2.1.6.1 远程 登录 


TCP/IP 的 远程 登录 标准 为 TELNET, OSI 所 定 的 远程 登录 标准 称 为 虚拟 终端 VT CVirtual 
Terminal) 。 由 于 不 同 的 终端 机 会 有 各 种 型 号 ， 因 此 在 TCP/IP 的 TELNET 5 OSI VT 虚拟 终 
端 标准 中 都 提供 了 协商 (Negotiation) 机 制 ， 通 信 两 端 在 通信 之 前 ， 会 进行 协商 ， 并 交换 终 
端 机 环境 参数 (Profile) ， 直 到 彼此 达到 共识 之 后 才 进 行 应 用 系统 与 客户 端 之 间 的 数据 交换 。 

除了 共有 的 协商 功能 之 外 ，OSIVT 所 提供 的 终端 机 参数 模型 比 TELNET 多 。 

CL) VT 能 支持 控制 的 转换 ， 例 如 ASCII 的 警 铃 字符 (BELL) 5 EBCDIC 的 警 铃 字符 
各 有 不 同 的 内 码 定 义 。 而 TELNET 则 无 法 处 理 这 类 因 字 符 集 不 同 所 造成 的 字符 功能 差异 。 

(2) VT 能 够 提供 更 多 的 字符 显示 属性 ,例如 在 终端 屏幕 上 每 一 个 字符 都 可 以 定义 其 颜 
色 及 字 型 等 功能 。 

G) VT 能 够 提供 一 维 、 二 维 、 三 维 显示 区 域 。 而 TELNET 只 提供 翻 页 显示 模式 (Scroll 
Mode) 。 
2.1.6.2 文件 传输 


以 TCP/IP 所 制定 的 FTP 与 OSI 所 制定 的 FTAM (File Transfer, Access and Management? 
言 ， 两 者 都 提供 了 基本 文件 处 理 功能 ， 如 文件 复制 、 删 除 、 目 录 查 询 、 更 改 文件 名 、 文 件 
属性 的 对 应 等 。 但 是 由 于 TCP/IP 中 并 未 定义 数据 表示 层 来 执行 不 同系 统 间 数 据 储 存 内 码 转 
换 的 功能 , 因此 , 虽然 FTP 可 传送 任何 一 种 数据 类 型 文件 (如 IMAGE, ASCII, EBCDIC 等 ) , 
但 是 却 不 能 在 几 种 不 同 的 文件 格式 之 间 自 动 地 进行 内 码 转换 处 理 。 OSI 在 FTAM 中 则 定义 了 
一 套 虚拟 文件 储存 器 (Virtual File Store) ， 使 得 不 同 计算 机 系统 间 在 交换 文件 时 ， 首 先 将 本 
身 的 文件 格式 与 文件 属性 对 应 转换 成 标准 的 虚拟 文件 储存 格式 送出 ， 对 方 在 收 到 此 虚拟 文件 
数据 后 , 再 根据 其 自己 的 文件 系统 与 虚拟 文件 储存 的 对 应 关系 , 转换 成 属于 自己 的 文件 格式 ， 
以 解决 不 同文 件 系统 间 对 文件 格式 处 理 方式 不 尽 相 同 的 问题 。 
以 文件 传输 效率 而 言 ， 由 于 OSIFTAM 在 文件 传输 的 过 程 中 ， 必 须 先 将 文件 对 应 成 虚拟 
文件 格式 ， 再 通过 表示 层 的 抽象 符号 语法 转换 成 网 络 上 标准 的 文件 传输 数据 ， 会 花费 许多 时 
间 。 反 观 TCP/IP FTP， 不 但 省 去 了 上 述 的 转换 动作 ， 同 时 还 可 依 文件 的 性 质 ， 选 择 压缩 模式 
(Compressed Mode) ， 提 供 更 有 效率 的 文件 传输 方法 。 因 此 平均 而 言 ，TCP/IP FIP 将 会 比 
OSI FTAM 文件 传输 的 效率 高 。 
TCP/IP FTP 与 OSI FTAM 在 不 同 的 功能 层次 虽 各 擅 胜 场 ， 但 就 目前 的 使 用 状况 来 说 ， 
TCP/IP FTP 却 比 OSI FTAM 要 普遍 得 多 。 


2.1.6.3 邮件 传输 
在 邮件 处 理 方面 , 由 于 TCP/IP 的 SMTP 发 展 时 间 较 早 , 因此 目前 采用 得 较 广泛 。 但 OSI 
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所 制定 的 MHS (Message Handling Systems) ， 在 功能 上 比 TCP/IP SMTP 更 完整 ， 且 具有 传 
输 过 程 可 靠 、 邮 件 处 理 的 功能 较 多 等 应 用 潜力 。 以 下 列 出 OSI MHS 所 提供 的 一 些 TCP/IP 
SMTP 没有 的 功能 : 

COD 可 指定 邮件 传递 的 时 间 与 邮件 的 处 理 优先 级 〈 如 急 件 、 速 件 、 正 常 邮件 ) ， 并 设 
定 邮件 内 容 的 敏感 度 〈Sensitivity) 。 

(2) 可 设 定 双 挂号 邮件 传递 以 确认 邮件 已 正确 送 抵 收 件 人 邮箱 中 ， 或 传 回 递送 失败 报 
告 给 发 信人 查 明 失 败 原因 。 

(3) 邮件 的 内 容 格式 除了 文字 以 外 ， 尚 能 传输 许多 其 他 的 多 媒体 类 型 。 而 在 TCP/IP 
SMTP 中 ,文件 的 内 容 格式 只 能 是 一 般 的 文字 文件 ， 若 要 传输 多 媒体 的 数据 则 需 配 合 MIME 
协议 。 

2164 网络 管理 

网 络 管理 方面 ，TCP/IP 与 OSI 的 协议 均 不 限定 只 能 在 本 身 的 网 络 上 运作 : TCP/IP 所 发 
展 出 来 的 网 络 管理 协议 可 以 利用 其 他 通信 网 路 协议 作 运 行 的 基础 , 而 OSI 的 相应 协议 也 可 以 
1E TCP/IP 的 通信 网 路 协议 之 上 运行 ( 称 为 Common Management Information Service From OSI 
on TCP/IP, CMOT) 。 因 此 ， 我 们 将 范围 限定 在 SNMP 与 CMIP 两 者 间 的 本 身 功能 作 比较 。 

基本 上 ，SNMP 所 提供 的 是 一 套 能 满足 基本 需求 的 简单 网 络 管理 协议 ， 它 具有 简单 、 容 
易 制作 等 优点 ,执行 时 所 占用 的 内 存 及 使 用 的 CPU 资源 也 较 少 。 由 于 其 实际 被 利用 的 经 1 
较 多 ， 目 前 在 网 络 上 使 用 的 广泛 程度 大 于 CMIP。 以 下 将 SNMP 与 CMIP 功能 的 异同 整理 如 
下 。 

SNMP 与 CMIP 都 提供 以 下 的 管理 功能 。 

(1) 网 络 发 生 错 误 时 的 处 理 (Fault Management) o 

(2) 网 络 运行 性 能 评估 (Performance Management) . 

(3) 网 络 会 计 管理 (Accounting Management) 。 

(4) 被 管理 对 象 (Managed Object) 的 名 称 配 置 与 鉴别 (Configuration and Name 
Management) 。 

不 同 之 处 在 于 : 

COD 通信 联机 : CMP 会 预先 建立 通信 管道 才 执行 管理 命令 ， 而 SNMP 则 采用 无 连接 
方式 的 网 络 联机 管理 方式 ， 所 以 平均 而 言 SNMP 的 额外 负担 较 少 ， 但 相对 地 ，CMIP 通信 管 
理 质量 则 较为 稳定 可 靠 。 

(2) 管理 模式 SNMP 采用 轮 询 式 (Polling-based) 的 管理 模式 ， 管 理 者 会 定期 询问 被 
管理 者 ， 两 者 间 的 联系 较 密切 ， 不 过 这 种 方式 会 使 网 络 上 的 数据 传输 量 增 加 ， 同 时 在 网 络 上 
同一 个 管理 者 将 无 法 同时 管理 网 络 上 的 许多 点 。 CMIP 采用 基于 事件 的 管理 模式 (Event-based 
Management) ， 被 管理 者 利用 异步 的 方式 ， 将 预定 发 生 的 事件 通知 管理 者 处 理 。 

(3) 管 理 信息 :SNMP 与 CMIP 的 网 络 信息 都 是 使 用 对 象 (Object) 来 表示 , 并 采用 ISO 
所 定义 的 抽象 符号 语法 描述 基本 编码 方式 (BER-Basic Encoding Rule) 来 表示 一 个 对 象 。 但 
目前 SNMP 仅 使 用 了 部 分 的 抽象 符号 语法 规则 , 因此 所 能 定义 的 对 象 类 型 及 属性 比 CMIP 所 
能 定义 的 少 。 

(4) 网 络 安全 : CMIP 的 在 网 络 安全 的 管理 功能 比 SNMP 完整 ， 可 提供 管理 之 间 的 鉴 
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权 (Authentication)、 访 问 控制 (Access Control)、 加 密 密 钥 管理 (Key for Enciphering Code) 、 
授权 (Authorization) 、 安 全 日 志 (Security Log) 等 安全 管理 机 制 。 而 SNMP 在 这 方面 的 机 
能 上 相对 较 弱 。 

就 目前 的 网 络 环境 而 言 ， 真 正在 TCP/IP 中 发 展 的 应 用 环境 比较 成 熟 ， 且 它 在 运行 时 所 
需要 的 系统 资源 较 少 。 除 此 之 外 , TCP/IP 还 提供 了 网 络 文件 系统 (NFS) 、 远 程 调用 (Remote 
Procedure Call, RPC) 、 窗 口 操作 系统 (X-Windows) 等 其 他 应 用 背景 ， 而 这 些 功能 则 尚未 
在 OSI 定义 的 应 用 标准 中 。 所 以 ， 目 前 有 一 些 应 用 需求 无 法 利用 OSI 的 方式 来 设计 。 

总 体 而 言 ，OSI 所 制定 的 应 用 标准 ， 大 致 上 来 说 比 TCP/IP 的 相应 功能 完整 丰富 且 精 细 ， 
但 却 始终 无 法 在 电信 网 络 及 数据 网 络 中 快速 成 长 。 除 了 上 述 的 原因 之 外 ， 可 能 也 是 由 于 其 相 
关 产 品 过 于 复杂 ， 且 需要 庞大 的 人 力 与 经 费 支 持 。 此 外 ，OSI 的 标准 制定 过 程 太 过 缓慢 ， 也 
使 它 的 应 用 受到 限制 。 

上 面 已 经 从 宏观 上 了 解 了 TCP/IP 协议 栈 的 架构 ， 并 比较 了 其 和 OSI 七 层 模型 的 异同 ， 
那么 作为 核心 的 IP 层 究 竟 是 如 何 工 作 的 呢 ? 运行 在 网 络 层 上 的 路 由 器 如 何 互 联 异 种 网 络 ? 
下 面 ， 深 入 探讨 一 下 其 工作 原理 。 
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路 由 器 作为 网 络 层 的 核心 设备 ， 在 网 络 中 处 于 至 关 重 要 的 位 置 。 它 可 以 连接 不 同类 型 的 
网 络 ， 能 够 选择 数据 传输 路 径 并 对 数据 进行 转发 。 从 通信 和 角度 看 ， 路 由 器 仍然 是 一 种 中 继 系 
统 ， 与 中 继 器 和 网 桥 类 似 ， 但 从 计算 机 网 络 的 角度 看 ， 它 与 中 继 器 和 网 桥 设备 是 运行 在 协议 
BAAR Z EN. TE IP 网 络 发 展 的 最 初 ,早期 路 由 器 就 被 称 为 网 关 , 这 主要 是 因为 它们 常常 
作为 本 地 校园 网 和 广域网 之 间 的 网 络 接口 。 现 在 的 网 关 则 是 指 网 络 层 以 上 的 中 继 系统 ， 如 应 
用 层 网 关 。 但 是 ， 由 于 习惯 问题 ， 一 些 固有 的 称呼 仍然 被 保留 ， 因 此 往往 需要 根据 上 下 文 意 
思 判 断 其 具体 含义 。 

路 由 器 是 用 于 连接 多 个 逻辑 上 分 开 的 网 络 ， 因 此 ， 路 由 器 具有 转发 报 文 和 路 由 选择 两 大 
功能 ， 它 能 在 异种 网 络 互联 环境 中 ， 建 立 灵活 的 连接 ， 可 用 完全 不 同 的 数据 分 组 和 介质 访问 
方法 连接 各 种 子 网 。 它 不 关心 各 子 网 使 用 的 硬件 设备 ， 但 要 求 运行 与 网 络 层 协议 相 一 致 的 软 
件 。 一 般 来 说 ， 异 种 网 络 互联 与 多 个 子 网 互联 都 应 采用 路 由 器 来 完成 。 


2.2.1 路 由 器 的 工作 原理 


当下 子 网 中 的 一 台 主机 发 送 人 P 报 文 给 同一 子 网 的 另 一 台 主 机 时 , 它 将 直接 把 他 报 文 送 

到 网 络 上 ,对 方 就 能 收 到 。 而 要 送 给 不 同 P 子 网 上 的 主机 时 ,， 它 要 选择 一 个 能 到 达 目 的 子 网 

上 的 路 由 器 ， 把 IP 报 文 送 给 该 路 由 器 ， 由 路 由 器 负责 把 IP 报 文 送 到 目的 地 。 如 果 没 有 找到 

这 样 的 路 由 器 ， 主 机 就 把 IP 报 文 送 给 一 个 称 为 “默认 网 关 ” (default gateway) 的 路 由 器 上 。 

“默认 网 关 ” 是 每 台 主机 上 的 一 个 配置 参数 ， 它 是 接 在 同一 个 网 络 上 的 某 个 路 由 器 端口 的 人 P 
地 址 。 

路 由 器 转发 他 报 文 时 ， 只 根据 IP 报 文 目的 下 地址 的 网 络 号 部 分 ， 选择 合适 的 端口 ， 把 

下 报 文 送出 去 。 同 主机 一 样 ， 路 由 器 也 要 判定 端口 所 接 的 是 否 是 目的 子 网 ， 如 果 是 ， 就 直接 
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把 报 文通 过 端口 送 到 网 络 上 , 否则 , 也 要 选择 下 一 个 路 由 器 来 传送 报 文 。 路 由 器 也 有 它 的 “ 默 
认 网 关 ”， 用 来 传送 不 知道 往 哪儿 送 的 IP 报 文 。 这 样 ， 通 过 路 由 器 把 知道 如 何 传送 的 人 P 报 
文正 确 转 发 出 去 ， 不 知道 的 IP 报 文 送 给 “默认 网 关 ” 路 由 器 ， 这 样 一 级 级 地 传送 ，IP Hox 
最 终 将 送 到 目的 地 ， 送 不 到 目的 地 的 下 报 文 则 被 网 络 丢 弃 了 。 


2.2.2 ”路 由 器 的 功能 


前 面 提 到 路 由 器 具有 转发 报 文 和 路 由 选择 两 大 功能 ， 那 么 它们 各 自 是 如 何 工 作 的 呢 ? 转 
发 的 意思 是 指 为 经 过 路 由 器 的 每 个 数据 报 文 寻找 一 条 最 佳 传输 路 径 ， 并 将 该 数据 有 效 地 传送 
到 目的 站 点 。 路 由 器 首先 在 路 由 表 中 查找 ， 判 明 是 否 知道 如 何 将 分 组 发 送 到 下 一 个 站 点 〈 路 
由 器 或 主机 ) ， 如 果 路 由 器 不 知道 如 何 发 送 分 组 ， 通 常 将 该 分 组 丢弃 ， 否 则 就 根据 路 由 表 的 
相应 表 项 将 分 组 发 送 到 下 一 个 站 点 ， 如 果 目 的 网 络 直接 与 路 由 器 相连 ， 路 由 器 就 把 分 组 直接 
送 到 相应 的 端口 上 。 这 就 是 路 由 转发 协议 (routed protocol) 。 下 面 以 作者 本 机 中 的 路 由 表 为 
例 来 说 明 转 发 的 过 程 〈 注 : 本 机 的 IP 地 址 为 211.65.59.36) 。 

在 命令 提示 符 下 运行 netstat -mm， 将 出 现 如 下 信息 


Route Table 


LU rere ire aa eee et eae a eat rae as MS TCP Loopback interface 
Ox2 ...00 03 Of fe 3a ec ...... DigitalChina DCN-530TX Fast Ethernet Adapter 
数据 包 计划 程序 微型 接口 


Network Destination Netmask Gateway Interface Metric 
0.0.0.0 0.0.0.0 211.65.59.4 211.65.59.36 20 
127.0.0.0 255.0.0.0 127.0.0.1 127.0.0.1 1 
172.16.0.0 255.240.0.0 211.65.59.1 211.65.59.36 1 
202.119.0.0 255.255.224.0 211.65.59.1 211.65.59.36 1 
202.119.144.0 255.255.240.0 211.65.59.1 211.65.59.36 i 
211.65.32.0 255.255.224.0 211.65.59.1 211.65.59.36 i 
211.65.59.0 255.255.255.0. 211.65.59.36  211.65.59.36 20 
211.65.59.36 255.255.255.255 127.0.0.1 127.0.0.1 20 
211.65.59.255 295.255.259.255 211.65.59.36  211.65.59.36 20 
224.0.0.0 240.0.0.0 211.65.59.36 211.65.59.36 20 
255.255.255.255 255.255.255.255 211.65.59.36 211.65.59.36 1 

Default Gateway: 211.65.59.4 


Persistent Routes: 


Network Address Netmask Gateway Address Metric 
211.65.59.0 255.255.255.0 211.65.59.36 X 
202.119.0.0 255.255.224.0 211.65.59.1 1 


202.119.144.0 255.255.240.0 211.65.59.1 b 
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211.65.32.0 255.255.224.0 211.65.59.1 x 
172.16.0.0 255.240.0.0 211.65.59.1 t 


第 1 行 说 明 , 如果 报 文 目的 地 址 是 loopback 地 址 127.0.0.0, 将 通过 loopback 接 口 127.0.0.1 
送 达 。 这 里 简要 说 明 一 下 网 络 127.0.0.0 作为 全 通 路 被 保留 到 主机 。 通 常 ， 地 址 127.0.0.1 将 
在 主机 上 被 分 到 一 个 特殊 的 接口 ， 即 所 谓 的 loopback 接口 ， 它 像 一 个 关上 的 电路 一 样 行 动 。 
来 自 TCP 或 UDP 被 传递 给 它 的 任何 他 包 将 被 返回 到 它们 自身 ,好 像 它 刚 从 一 些 网 络 到 达 了 。 
这 允许 用 户 开发 并 且 测 试 曾经 没有 使 用 一 个 “真实 ”网 络 的 联网 软件 。 

第 4 行 说 明 ， 如 果 报 文 目标 网 络 地 址 是 202.119.0.0， 则 将 通过 作者 所 在 LAN 的 网 关 
211.65.59.1 转发 至 目标 子 网 。 

第 8 行 说 明 ， 报 文 的 目标 地 址 就 是 本 机 的 话 ， 则 直接 通过 loopback 接口 127.0.0.1 发 送 
到 本 机 。 

Default Gateway 说 明 : 当 搜索 完 路 由 表 中 的 所 有 表 项 都 不 能 找到 匹配 待 发 报 文 目标 地 
址 ， 则 将 待 发 报 文 转 往 Default Gateway。 

路 由 选择 即 判定 和 构造 到 达 目 的 地 的 最 佳 路 径 ， 由 路 由 选择 算法 来 实现 。 由 于 涉及 到 不 
同 的 路 由 选择 协议 和 路 由 选择 算法 ， 要 相对 复杂 一 些 。 为 了 判定 最 佳 路 径 ， 路 由 选择 算法 必 
须 启 动 并 维护 包含 路 由 信息 的 路 由 表 ， 其 中 路 由 信息 依赖 于 所 用 的 路 由 选择 算法 而 不 尽 相 
同 。 路 由 选择 算法 将 收集 到 的 不 同 信息 填 入 路 由 表 中 ， 根 据 路 由 表 可 将 目标 网 络 与 下 一 跳 

(nexthop) 的 关系 告诉 路 由 器 。 路 由 器 间 互 通信 息 进 行路 由 更 新 ， 更 新 维护 路 由 表 使 之 正确 
反映 网 络 的 拓扑 变化 ， 并 由 路 由 器 根据 量度 来 决定 最 佳 路 径 。 这 就 是 路 由 协议 〈routing 
protocol) ， 例 如 路 由 信息 协议 CRIP) 、 开 放 式 最 短路 径 优先 协议 (OSPF) 和 边界 网 关 协 议 

(BGP) 等 ， 我 们 将 在 第 6 章 给 予 详细 阐述 。 

简 言 之 ， 路 由 转发 协议 可 视 为 一 个 如 何 查找 路 由 表 以 决定 最 佳 传输 路 径 的 一 组 规则 ， 而 
路 由 协议 则 是 根据 路 由 选择 算法 搜集 到 的 网 络 信息 构造 路 由 表 表 项 的 方法 。 


2.5 TCP/IP 各 层 协议 组 成 


TCP/IP 各 层 协议 的 详细 描述 将 在 后 文中 予以 介绍 ， 这 里 先 从 宏观 上 认识 一 下 TCP/IP 协 
议 栈 的 架构 并 简单 介绍 各 层 协议 的 功能 。 由 图 2.2 可 了 解 TCP/IP 协议 在 整个 协议 族 所 占 位 置 
的 重要 性 。 


应 用 层 Telnet FIP HTTP SMTP DNS 


传输 层 TCP UDP 


网 络 层 | arp | RARp | icmp | IGMP 


逻辑 链 路 子 层 
介质 访问 子 层 


数据 链 路 层 


物理 层 SONET/SDH/PDH 
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图 2.2 TCP/IP 协议 集 族 


从 图 22 中 可 以 看 到 ，Internet 协议 族 主要 功能 集中 在 第 3~4 层 ， 通 过 增加 软件 模块 来 
保证 和 已 有 系统 的 最 大 兼容 性 。 

在 网 络 层 上 ， 地 址 解答 协议 ARP (Address Resolution Protocol) 实现 IP 地 址 向 物理 地 址 
的 映射 ， 反 向 地 址 解答 协议 RARP (Reverse Address Resolution Protocol) 实现 物理 地 址 向 IP 
地 址 的 映射 ， 网络 层 协议 IP 提供 结 点 之 间 的 报 文 传送 服务 ，Internet 报 文 控制 协议 ICMP 

(Internet Control Message Protocol) 传输 差错 控制 信息 以 及 主机 /路 由 器 之 间 的 控制 信息 ; 
Internet 组 管理 协议 IGMP (Internet Group Management Protocol) 能 让 一 个 物理 网 络 上 的 所 有 
系统 知道 主机 当前 所 在 的 多 播 组 。 

在 传输 层 上 ， 传 输 控制 协议 TCP (Transmission Control Protocol) 提供 用 户 之 间 的 面向 
连接 可 靠 报 文 传输 服务 ， 用 户 数据 报 协议 UDP (User Datagram Protocol) 提供 用 户 之 间 的 不 
可 靠 无 连接 的 报 文 传输 服务 。 

在 应 用 层 上 ，Telnet 提供 远程 登录 (终端 仿真 服务 文件 传输 协议 FTP (File Transfer 
Protocol) 提供 应 用 级 的 文件 传输 服务 ;简单 邮件 传输 协议 SMTP (Simple Mail Transfer 
Protocol) 提 供 简单 的 电子 邮件 发 送 服务 ; 超 文本 传输 协议 HTTP(HyperText Transfer Protocol) 
提供 万 维 网 浏览 服务 ， 域 名 系统 DNS (Domain Name System) 负责 域名 和 IP 地 址 的 映射 ; 
其 他 服务 (Others) 支持 其 他 的 应 用 服务 。 

因特网 通过 信息 的 传输 向 用 户 提供 各 种 服务 ， 类 似 OSIURM， 各 层 可 提供 的 服务 通过 各 
层 的 控制 协议 ， 并 经 过 各 层 实体 的 合作 了 予以 实现 。 


B35 IP 协议 


IP 协议 是 整个 TCP/IP 协议 族 中 最 重要 的 协议 。 它 位 于 物理 链 路 层 之 上 ， 向 上 层 协议 屏蔽 
了 各 种 不 同 的 物理 链 路 的 差别 ， 因 此 能 将 各 种 不 同 介质 的 网 络 互联 起 来 。 所 有 在 Internet 上 传 
输 的 数据 都 以 IP 数据 包 格式 传输 。 卫 提供 不 可 靠 (unreliable) 、 无 连接 的 数据 包 传送 服务 ， 
即 它 不 能 保证 IP 数据 包 能 成 功 地 到 达 目 的 地 。 人 P 仅 提供 最 好 〈bestreffort) 的 传输 服务 。 

在 本 章 中 ,我 们 将 主要 介绍 IP 协议 的 工作 原理 及 他 数据 包 的 详细 格式 , 但 人 P 数据 包 中 
与 错误 控制 等 相关 的 内 容 将 放 在 相应 章节 进行 介绍 。 


31 IP 协议 的 目的 与 工作 原理 


IP 协议 的 目的 是 提供 不 可 靠 Cunreliable) 、 无 连接 的 数据 包 传送 服务 ， 仅 提供 最 好 的 

(best-effort) 传输 服务 。 因 此 可 以 看 出 IP 协议 就 是 要 将 Internet 上 的 数据 尽 可 能 地 从 产生 地 

传输 到 数据 的 目的 地 。 为 了 了 解 IP 协议 的 详细 的 工作 机 制 ， 必 须 先 了 解 IP 协议 的 工作 原理 
及 其 中 包含 的 一 些 基 本 概念 ， 因 此 本 节 将 向 读者 提供 这 些 知识 。 


3.1.1 IP 协议 数据 的 传输 过 程 


从 第 2 章 可 以 知道 ， 整 个 TCP/IP 协议 族 的 工作 都 是 以 数据 包 和 存储 转发 机 制 为 基础 的 ， 
IP 协议 也 使 用 这 一 原理 。 下 面 ， 以 一 个 形象 的 比喻 来 说 明 IP 协议 数据 的 传输 过 程 。 

我 们 先 看 看 传统 的 邮件 传递 系统 的 工作 过 程 ， 如 图 3.1 所 示 。A 市 A 区 的 发 送 人 王 某 要 
写 一 封 信件 给 B 市 B 区 的 李 某 。 那 么 在 王 开始 写 信 到 李 接 收 到 信件 这 个 过 程 中 都 发 生 了 一 些 
什么 事情 呢 ? 首先 王 要 将 写 好 的 信 装 进 一 个 信封 ， 并 在 信封 上 写 好 接收 人 的 地 址 〈 例 如 北京 
市 清华 大 学 ) 和 接收 人 姓名 ， 然 后 将 信 投 进 邮局 A 设 的 信箱 。 邮 局 A 的 邮递 员 将 信箱 中 的 
信件 带 回 邮局 A。 所 有 的 信件 在 邮局 A 根据 其 目的 地 进行 分 类 并 打包 。 打 包 后 的 信件 会 运算 
到 A 市 的 总 邮局 A。 在 总 邮局 A， 信 件 包 将 被 运送 到 B 市 的 总 邮局 ， 这 次 运送 可 以 通过 多 种 
交通 方式 ， 如 汽车 、 火 车 、 飞 机 等 。 总 邮局 将 根据 信件 接收 人 的 详细 地 址 将 信件 分 发 到 不 同 
的 区 邮局 ， 那 么 李 的 信件 就 运送 到 了 邮局 B。 最 后 邮局 B 的 邮递 员 将 信件 投递 到 李 的 信箱 ， 
李 就 可 以 从 信箱 接收 到 邮件 了 。 

我 们 可 以 将 IP 协议 的 工作 过 程 和 信件 递送 的 过 程 进 行 比较 , 它们 之 间 是 非常 类 似 的 。 我 
们 可 以 将 图 3.1 中 的 区 看 作 是 主机 系统 〈 工 作 站 、 服 务 器 等 ) ， 将 市 看 作 是 局 域 网 ， 而 将 整 
个 邮政 系统 看 作 是 Intemet。 在 发 送 方 ， 主 机 系统 首先 将 要 发 送 的 数据 准备 好 并 指明 目的 地 ， 
然后 将 数据 交 给 IP 协议 ( 即 邮 局 AD . IP 协议 将 数据 组 成 他 包 ( 即 将 信件 打包 ) 并 将 数据 
包 发 送 到 网 络 设备 《交换 机 或 路 由 器 ) ， 由 网 络 设备 将 数据 包 传送 到 正确 的 目的 地 。 在 接收 
Jj. 网 络 设备 接收 到 TP 数据 包 后 会 根据 其 目的 地 址 将 数据 包 发 送 给 主机 系统 。 这 样 整个 数据 
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的 传送 就 完成 了 。 
A 市 BB 市 
A 区 A A B 区 
(8 iit} ca >> ll 2 ft e+ 
BEN 邮局 A 总 邮局 A 总 邮局 B E: 接收 人 


3.1 ”邮政 系统 信件 传递 过 程 


虽然 他 协议 的 工作 原理 与 信件 递送 过 程 相 似 ， 但 也 存在 着 一 定 的 区 别 : 

a) 信件 递送 过 程 中 ， 信 件 的 收集 是 定时 的 。 图 3.1 中 邮局 A 的 邮递 员 会 在 每 日 定时 
前 往 邮 箱 收集 信件 。 但 在 IP 协议 中 ， 只 要 待 发 送 的 数据 准备 好 ， 随 时 可 以 交 给 IP 协议 处 理 。 

(2) 信件 打包 时 ， 只 会 组 包 ， 即 将 多 封 信件 打 成 一 个 包 。 在 卫 协议 中 不 会 将 小 的 数据 
组 成 一 个 大 包 ， 只 会 将 过 大 的 数据 分 解 成 小 包 。 

G) 在 图 3.1 F, A TREB 市 不 同 区 的 包 可 能 会 打 在 同一 个 包 中 ,然后 信件 包 在 总 邮 
局 B 需要 按 不 同 区 进行 分 解 和 重新 组 合 。 在 IP 协议 中 不 会 将 不 同 地 址 的 数据 包 组 合成 一 个 
包 。 


3.1.2 IP 协议 中 的 概念 


IP 协议 的 工作 过 程 中 包含 了 几 个 重要 概念 。 

首先 , IP 协议 的 工作 对 象 是 数据 包 。 IP 协议 在 处 理 数据 包 时 ， 只 会 根据 数据 包 本 身 的 情况 
来 处 理 数据 包 ， 不 会 考虑 不 同 数据 包 之 间 的 关系 。 因此， 对 两 个 目的 地 相同 的 数据 包 的 处 理 可 
能 是 不 同 的 。 在 介绍 他 协议 数据 包 格式 时 我 们 将 详细 说 明 IP 协议 是 如 何 处 理 数据 包 的。 

FEM, IP 协议 的 责任 是 将 数据 正确 传递 到 目的 地 。 那 么 IP 协议 必须 能 够 表示 和 识别 数 
据 包 的 地 址 ， 并 能 根据 地 址 选择 数据 包 传递 的 路 径 。 其 中 第 一 个 问题 将 在 3.2 节 说 明 。 而 路 
径 选 择 问 题 放 在 第 6 章 介绍 。 

最 后 , IP 协议 是 提供 不 可 靠 数 据 传递 服务 的 协议 。 正 如 信件 有 时 无 法 投递 一 样 ， 卫 协议 
的 数据 包 有 了 时 也 无 法 传送 到 目的 地 。 在 他 协议 中 有 一 整套 的 错误 处 理 机 制 用 来 诊断 并 处 理 数 
据 包 无 法 传送 的 情况 。 


3.2 IP 地 址 


正如 上 节 所 述 , IP 协议 要 将 数据 正确 传递 到 目的 地 ， 就 必须 能 够 表示 和 识别 数据 包 的 地 
址 。IP 地 址 是 一 种 用 二 进 制 数 表示 的 地 址 ， 它 是 Internet 上 主机 的 惟一 标识 。Intemet 上 的 每 
一 台 主 机 都 被 赋予 一 个 惟一 的 32 位 的 整数 , 这 个 整数 就 是 他 地 址 。 为 了 便于 根据 他 地址 寻 
找到 代表 该 地 址 代表 的 主机 , 这 个 整数 被 分 为 两 个 部 分 : 网 络 ID (netid) 和 主机 ID (hostid) 。 
由 于 下 数据 包 的 传递 是 根据 他 地 址 进行 的 , 因此 TP 地 址 结构 和 组 织 的 合理 性 就 会 影响 数据 
包 传 递 的 效率 。 为 此 ， 卫 地 址 就 包含 了 一 些 复杂 的 技术 ， 我 们 在 本 节 中 加 以 详细 说 明 。 
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3.2.4 IP 地 址 的 分 类 
卫 地 址 分 为 A、B、C、D、E 五 类 ， 如 图 3.2 所 示 。 


01234 8 16 24 31 


AX |0 netid hostid 
BÆ |1|0 netid hostid 
c |1|1|0 netid hostid 
D% |1110 multicast address 
EX |1|1|1|1|0 reserved 
图 3.2 人 P 地 址 分 类 


从 图 3.2 可 以 看 出 ， 五 类 下 地 址 中 ， 目 前 使 用 其 中 的 前 四 类 ， 且 D 类 地 址 是 多 播 地 址 。 
那么 用 来 标识 网 络 上 的 主机 和 设备 的 就 只 有 前 面 的 三 类 了 。A、B、C 三 类 IP 地 址 都 由 三 部 
分 组 成 : 地 址 类 别 标识 、netid 和 hostid。 其 中 地 址 类 别 标识 表明 了 该 地 址 所 属 的 地 址 类 别 。 
netid 则 是 某 个 网 络 的 标识 ， 所 有 netid 部 分 相同 的 他 地 址 都 属于 同一 个 网 络 。hostid 则 是 用 
来 区 分 同一 个 网 络 中 的 不 同 主机 和 设备 的 。 同 传统 的 通信 地 址 相 比 ，netid 就 类 似 于 市 名 ， 
hostid 则 是 分 邮局 的 管理 范围 ， 至 于 收 信人 的 确切 地 址 ， 我 们 在 讨论 UDP 和 TCP 时 再 进行 
对 比 。 由 于 IP 地 址 有 上 述 的 结构 ， 所 以 网 络 设备 在 转发 IP 数据 包 时 ， 只 需要 先 根据 IP 地 址 
的 netid 找到 该 IP 地 址 所 属 的 网 络 ， 再 由 该 网 络 中 的 设备 根据 hostid 将 数据 包 转 发 给 网 络 中 
的 相应 主机 或 设备 。 这 与 传统 邮局 投递 系统 的 原理 是 相同 的 。 

我 们 再 来 看 看 前 三 类 地 址 的 格式 。 为 什么 要 将 它们 分 为 A、B、C 三 类 呢 。 从 图 3.2 中 可 
以 看 到 ，A 类 地 址 的 netid 部 分 短 而 hostid 部 分 长 ， 而 C 类 地 址 的 netid 部 分 长 而 hostid 部 分 
短 。 因此 A 类 地 址 能 表示 的 网 络 少 , 但 单个 网 络 中 的 主机 或 设备 可 以 很 多 , 而 C 类 地 址 能 表 
示 的 网 络 多 ， 但 单个 网 络 中 的 主机 和 设备 较 少 ，B 类 地 址 的 各 项 都 适中 。 之 所 以 这 样 分 是 为 
了 节省 IP 地址 资源 ,使 得 不 同 规模 的 网 络 可 以 使 用 相应 类 别 的 他 地址 , 不 至 于 造成 他 地 址 
的 浪费 。 例 如 大 公司 的 网 络 是 一 个 大 型 网 络 ， 那 么 它 就 可 以 使 用 A 类 地 址 。 小 公司 的 网 络 中 
的 主机 和 设备 比较 少 ， 它 就 可 以 使 用 C 类 地 址 。 由 于 Internet 的 迅速 发 展 ， 使 得 接 入 的 主机 
和 设备 飞速 增多 ， 造 成 了 IP 地 址 资源 的 紧张 。 我 们 在 后 面 还 会 讨论 其 他 的 IP 地 址 技术 ， 它 
们 可 以 更 有 效 地 利用 IP 地 址 资源 。 

我 们 还 需要 对 前 三 类 IP 地 址 的 hostid 进一步 说 明 。 通 常 所 有 位 都 为 0 和 所 有 位 都 为 1 
的 下 地 址 被 赋予 了 特殊 的 意义 ， 不 能 用 来 表示 网 络 中 的 主机 和 设备 。 所 有 位 都 为 0 的 他 地 
址 用 来 代表 整个 网 络 本 身 ， 而 所 有 位 都 为 1 89 IP 地 址 则 用 来 表示 网 内 广播 。 

对 netid 也 有 一 个 特殊 情况 ， 就 是 所 有 位 都 为 0 的 netid。 这 样 的 netid 用 来 代表 本 网 络 。 
这 对 于 那些 需要 进行 通信 却 不 知道 本 网 络 地 址 的 主机 非常 有 用 。 


3.2.2 IP 地 址 的 表示 
由 于 下 地 址 是 一 个 32 位 的 整数 ， 所 以 很 自然 地 , 在 TP 协议 的 实现 中 , IP 地 址 就 被 表示 


为 一 个 32 位 的 整形 数 。 但 这 种 表示 方法 不 方便 人 的 阅读 与 记忆 。 所 以 卫 就 被 显示 为 四 个 由 
点 隔 开 的 十 进 制 整数 。 即 在 图 3.2 中 按照 从 左 到 右 的 顺序 将 32 位 分 为 4 个 8 位 , 每 个 8 位 的 
十 进 制 表示 为 一 个 部 分 。 如 IP 地 址 : 


11001010 01110111 00001001 00011110 


就 表示 为 : 
202.119.9.30 
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这 种 表示 方法 便于 人 的 阅读 、 记 忆 和 交流 。 表 3.1 是 五 类 他 地 址 的 地 址 范围 。 


IP 地 址 类 别 


表 3.1 五 类 IP 地 址 的 地 址 范围 


最 大 地 址 


在 表 3.1 中 ,我 们 只 列 出 了 A、B、C 三 类 地 址 中 的 网 络 地 址 。 从 表 3.1 中 可 以 看 出 ，A、 
B. C 三 类 地 址 没有 包含 所 有 可 能 的 地 址 。 例 如 : A 类 地 址 127.0.0.0 没有 列 出 。 这 是 因为 地 
hb 127.x.xx 被 保留 用 作 回 环 (loopback) 地 址 。 目 标 地 址 为 127.x.x.x 的 数据 包 是 不 会 发 送 到 
网 络 上 的 ， 而 是 返回 到 本 机 ， 就 好 像 是 接收 到 一 个 数据 包 一 样 。 回 环 地 址 的 目的 是 为 了 方便 


0.1.0.0 


224.0.0.0 
240.0.0.0 


TCP/IP 的 测试 及 进程 间 通 信 。 


3.2.3 特殊 IP 地 址 总 结 
根据 对 地 址 的 描述 ,我 们 可 以 对 一 些 具有 特殊 作用 的 TP 地 址 进行 简单 归纳 ,如 图 3.3 


所 示 。 


127 


任意 


3.3. ”特殊 用 途 耳 地址 


126.0.0.0 
191.255.0.0 
223.255.255.0 
239.255.255.255 
247.255.255.255 


本 主机 

本 网 络 中 的 主机 
代表 整个 网 络 
netid 网 内 广播 
回环 

本 地 网 广播 


在 图 3.3 中 只 列 出 了 netid 和 hostid， 不 包含 地 址 类 别 标识 。 
3.24 IP 地 址 的 缺陷 


IP 地 址 是 一 种 结构 性 很 强 的 地 址 ， 其 原理 类 似 于 现实 世界 的 地 址 表示 方式 ， 便 于 IP Be 
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据 包 的 路 由 转发 。 但 IP 地 址 也 存在 自己 的 缺陷 。 

首先 ，IP 地 址 标识 的 网 络 主机 或 设备 与 Internet 的 连接 关系 ， 而 不 是 标识 主机 和 设备 本 
身 。 所 以 当主 机 从 一 个 位 置 移 动 到 另 一 个 位 置 时 ， 它 原 有 的 TP 地 址 将 会 变 得 无 法 使 用 ， 需 要 
重新 配置 一 个 新 的 IP 地 址 ， 这 个 新 卫 地 址 是 属于 它 现 在 所 处 网 络 的 地 址 。 

其 次 , TAX IP 地 址 之 间 巨 大 的 差异 已 经 浪费 了 大 量 的 地 址 。 举 例 来 说 , 一 个 中 等 规模 
的 公司 需要 300 个 IP 地 址 。 一 个 C 类 地 址 (254 个 地 址 ) 不 够 用 。 使 用 两 个 C 类 地 址 ， 提 
供 的 地 址 有 富余 ， 但 是 这 样 一 来 ， 一 个 公司 就 有 两 个 不 同 的 网 络 ， 增 加 了 路 由 表 的 尺寸 一 一 
每 一 个 地 址 空间 需要 一 个 路 由 表 项 〈 即 使 它们 属于 同一 个 组 织 ) 。 另 一 种 选择 是 ，B 类 地 址 
提供 了 所 有 需要 的 地 址 ， 而 且 是 在 一 个 网 络 中 。 但 是 这 样 却 浪费 了 65234 个 地 址 ， 当 一 个 网 
络 有 多 于 254 个 主机 时 就 提供 一 个 B 类 地 址 ， 这 种 情况 太 常见 了 。 因 此 ，B 类 地 址 比 其 他 地 
址 更 容易 耗 尽 。 

再 次 ， 当 一 个 组 织 的 C 类 网 络 扩大 时 ， 它 需要 更 改 整个 网 络 中 所 有 主机 与 设备 的 TP. 地 
址 ， 相 应 的 需要 对 各 种 软件 系统 的 配置 进行 修改 ， 很 容易 出 错 。 

但 这 些 问 题 都 得 到 了 解决 。 下 面 开始 讨论 IP 地 址 的 各 种 扩展 技术 。 
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对 于 某 些 中 等 规模 的 网 络 ， 一 个 C 类 的 IP 地 址 不 够 用 ， 而 使 用 B 类 的 IP 地 址 则 过 于 浪 
费 。 如 果 使 用 多 个 C 类 地 址 则 会 造成 一 个 组 织 有 多 个 网 络 域 ， 这 会 导致 路 由 器 中 的 路 由 表 会 
扩大 。 这 个 问题 在 Internet 发 展 的 初期 并 不 突出 ， 但 随 着 Internet 的 飞速 发 展 ， 接 入 网 络 的 增 
多 ， 问 题 就 逐渐 突出 了 。 解 决 方法 是 分 层 地 组 织 这 些 同 一 组 织 的 不 同 网 络 ， 并 在 它们 之 间 路 
Ho MA Internet 的 角度 看 具有 多 个 网 络 的 组 织 应 该 被 看 作 只 有 一 个 网 络 。 因 此 ， 它 们 应 该 共 
享 一 个 共同 的 IP 地 址 范围 。 

所 谓 的 子 网 技术 就 是 将 原 有 的 两 层 结 构 Cnetid 和 hostid) 的 IP 地 址 分 为 三 层 ， netid、 
subnetid 和 hostid. subnetid 和 hostid 是 由 原先 IP 地 址 的 hostid 部 分 分 割 成 两 部 分 得 到 。 因 此 ， 
用 户 分 子 网 的 能 力 依赖 于 被 子 网 化 的 IP. 地 址 类 型 。IP 地 址 中 hostid 位 数 越 多 ， 就 能 分 得 更 
多 的 子 网 和 主机 。 然 而 ， 子 网 减少 了 能 被 寻 址 主机 的 数量 。 实 际 上 ， 是 把 主机 地 址 的 一 部 分 
拿 走 用 于 识别 subnetid。 子 网 由 子 网 掩 码 标识 。 

子 网 掩 码 是 32 位 二 进 制 数 ， 可 用 与 IP 地 址 标识 格式 一 样 的 点 -十 进 制 数 格式 标识 。 子 网 
掩 码 告诉 网 络 中 的 端 系统 IP 地 址 的 多 少 位 用 于 识别 网 络 和 子 网 。 这 些 位 被 称 为 扩展 的 网 络 前 
绥 。 剩 下 的 位 标识 子 网 内 的 主机 ， 掩 码 中 用 于 标识 网 络 号 的 位 置 为 1， 主 机 位 置 为 0。 

虽然 使 用 子 网 掩 码 可 以 将 一 个 网 络 分 为 多 个 子 网 ， 但 它 还 是 有 缺陷 的 ， 即 一 个 网 络 只 能 
支持 一 个 子 网 掩 码 。 也 就 是 说 ， 一 旦 确定 了 网 络 的 子 网 掩 码 ， 那 么 网 络 中 各 子 网 所 允许 的 子 
网 规模 都 是 一 样 的 。 为 了 克服 这 个 缺点 ，VLSM (Variable-Length Subnet Mask) 技术 就 应 运 
而 生 。VLSM 允许 一 个 网 络 使 用 不 同 的 网 络 掩 码 以 适应 不 同 规模 子 网 的 要 求 ， 它 使 一 个 组 织 
的 他 地 址 空间 被 更 有 效 的 使 用 。 

为 了 说 明 VLSM 的 原理 与 作用 , 我 们 举 一 个 例子 。 假设 有 一 个 组 织 的 网 络 规模 可 以 使 用 
一 个 C 类 地 址 范围 。 但 该 网 络 需要 分 为 4 个 子 网 : 子 网 A、 子 网 B 和 子 网 C 和 子 网 D。 如 果 
JEH VLSM, 则 至 少 需要 将 子 网 掩 码 设置 为 235.255.255.192(11111111 11111111 11111111 
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11000000) 。 这 样 组 织 的 C 类 地 址 就 被 划分 成 了 4 个 等 大 小 的 子 网 ， 每 个 子 网 有 61 个 可 用 
地 址 ， 但 实际 情况 是 子 网 A 中 有 100 台 主 机 和 设备 ， 子 网 B 有 50 台 主 机 和 设备 ， 子 网 C 和 
D 都 有 20 多 台 主 机 和 设备 。 显 然 上 述 的 子 网 划分 方案 是 不 可 行 的 。 如 果 使 用 VLSM 则 可 以 
很 好 的 解决 ， 因 为 它 允 许 对 网 络 内 的 不 同 子 网 指定 不 同 的 掩 码 。 我 们 假设 该 组 织 的 C 类 地 址 
为 192.168.1.0， 那 么 该 组 织 的 子 网 划分 方案 则 如 图 3.4 所 示 。 


子 网 A 
子 网 掩 码 : 255.255.255.127 
地 址 范围 ， 192.168.1.1 一 
192.168.1.126 


子 网 B 
子 网 掩 码 ，255.255.255.192 地 
址 范围 : 192.168.1.129— 
192.168.1.190 


子 网 C 
子 网 掩 码 ，255.255.255.224 地 
址 范围 : 192.168.193 一 
192.168.1.222 


子 网 D 
子 网 掩 码 ，255.255.255.224 地 
址 范围 : 192.168.1.225 一 
192.168.1.254 


34 VLSM 应 用 示例 


从 图 3.4 可 以 看 出 ， 子 网 A 可 以 容纳 126 个 端 系统 ， 子 网 B 可 容纳 62 个 端 系统 ， 子 网 
C 和 子 网 DD 可 分 别 容纳 30 个 端 系统 。 这 种 子 网 划分 方案 可 应 用 到 更 大 的 网 络 中 。 
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虽然 使 用 子 网 技术 可 以 使 他 地址 得 到 有 效 的 利用 , 但 还 是 很 难 防止 TP 地 址 资源 的 耗 尽 。 
因为 任何 一 个 规模 超过 256 的 网 络 都 需要 使 用 B 类 地 址 ， 所 以 B 类 地 址 的 消耗 速度 尤其 快 ， 
而 C 类 地 址 却 得 不 到 应 用 。 解 决 这 个 问题 的 一 个 办 法 就 是 消除 IP 地 址 中 类 别 的 概念 。 只 要 
是 一 个 连续 的 地 址 范围 ， 就 可 以 将 其 分 配给 一 个 适当 规模 的 网 络 ， 使 地 址 资源 得 到 充分 的 利 
用 。 例 如 ， 我 们 可 以 将 几 个 连续 的 C 类 地 址 合并 在 一 起 ， 形 成 一 个 更 大 规模 的 地 址 范围 ， 这 
样 对 于 一 些 网 络 规模 小 于 该 规模 的 组 织 就 可 以 使 用 这 个 地 址 范围 了 。 这 种 技术 称 之 为 超 网 技 
Re CIDR 无 类 域 间 路 由 ) 技术 实现 了 超 网 技术 ， 它 不 但 消除 了 IP 地 址 类 别 的 概念 ， 使 他 
地 址 得 到 了 更 有 效 的 利用 , 还 极 大 地 减 小 了 路 由 器 中 路 由 表 的 大 小 , 使 卫 数据 包 的 转发 变 得 
更 加 高 效 。 

实际 上 CIDR 的 概念 和 子 网 技术 的 概念 基本 相同 。 在 子 网 技术 中 ， 子 网 的 标识 由 两 部 分 
组 成 : netid 和 subnetid。 由 于 netid 就 是 各 类 IP 地 址 中 的 netid， 而 subnetid 是 原 hostid 中 的 
一 部 分 ， 所 以 子 网 技术 只 能 做 到 把 原 IP 地 址 的 网 络 进行 划分 而 不 能 将 多 个 网 络 进行 合并 。 
CIDR 将 子 网 划分 的 概念 进一步 延伸 。 它 将 子 网 标识 的 两 个 部 分 合并 到 一 起 ， 不 加 以 区 分 ， 
且 对 子 网 标识 的 长 度 不 作 限 制 。 在 CIDR 中 将 这 个 子 网 标识 称 之 为 网 络 部 分 。 例 如 
192.169.53.27 是 一 个 C 类 地 址 ， 如 果 对 其 应 用 子 网 技术 则 子 网 掩 码 必 须 是 255.255.x.x， 也 即 
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子 网 标识 的 长 度 至 少 是 25 位 .但 如 果 使 用 CIDR 技术 , 则 可 以 将 地 址 表示 位 192.169.53.27/20， 
它 标识 地 址 的 前 20 位 是 网 络 部 分 ， 后 12 位 是 主机 部 分 。 那 么 该 地 址 的 网 络 地 址 就 是 
192.169.48.0， 而 该 网 络 可 以 容纳 4094 个 端 系 统 。 

从 上 述 例子 可 以 看 出 ，CIDR 技术 可 通过 设置 网 络 部 分 的 长 度 来 获得 各 种 规模 的 地 址 范 
围 ， 从 而 使 他 地 址 得 到 了 更 加 有 效 的 利用 。 


3.2.7 私有 网 络 地 址 


可 能 存在 这 样 的 情况 : 某 个 组 织 的 网 络 使 用 了 TCP/IP 技术 ， 但 并 没有 接 入 到 Internet. 
如 果 这 样 ， 该 组 织 应 该 可 以 使 用 任何 它 想 用 的 IP 地 址 ， 只 要 在 组 织 内 部 保证 IP 地 址 不 冲突 
即 可 。 但 是 ， 该 组 织 可 能 会 在 以 后 接 入 到 Intemet。 因 此 ， 如 果 该 组 织 当前 使 用 的 IP 地 址 和 
Internet 上 其 他 组 织 使 用 的 IP 地 址 冲突 的 话 ,日 后 它 接 入 Internet 时 就 必须 对 组 织 内 所 有 系统 
AY IP 地 址 进行 修改 并 对 相关 软件 的 配置 做 相应 修改 。 为 了 避免 这 种 情况 , IETF 分 别 从 A、B、 
C 三 类 地 址 中 取出 一 段 地 址 范围 保留 用 作 内 部 网 络 地 址 ， 它 们 分 别 是 : 

10.0.0.0 一 10.255.255.255 

172.16.0.0 一 172.31.255.255 

192.168.0.0 一 192.168.255.255 

这 些 地 址 范围 是 专门 用 来 标识 内 部 网 络 的 ， 不 能 用 来 访问 Internet, [473 Internet 上 的 路 
由 器 是 不 会 转发 目标 地 址 在 上 述 三 个 范围 内 的 数据 包 的 。 


33 IP 数据 包 格 式 


本 节 将 介绍 TP 数据 包 的 具体 格式 。 


3.3.1 网 络 字 节 序 和 主机 字 节 序 


在 介绍 IP 数据 包 的 格式 之 前 ， 必 须 说 明 整 数 在 计算 机 中 的 表示 方式 的 差别 及 TCP/P 协 
议 怎样 屏蔽 这 些 差 异 。 

在 计算 机 中 ， 最 基本 的 数据 长 度 单位 是 字 节 ，8 位 。 整 形 数 根据 其 能 表示 整数 范围 的 不 
同 ， 有 32 位 整数 、16 整数 和 8 位 整数 。8 位 整 型 数 因为 能 在 一 个 字 节 中 表示 ， 所 以 所 有 的 
计算 机 的 表示 都 是 一 样 的 。 但 16 位 整数 和 32 位 整数 必须 使 用 多 个 字 节 进行 表示 ， 而 不 同 的 
计算 机 中 对 表示 整数 中 的 多 个 字 节 的 解释 是 不 同 的 。 有 的 将 低 内 存 地 址 的 字 节 解释 为 整数 中 
低位 的 字 节 ， 这 种 字 节 序 称 为 little indian 序 ， 有 的 则 将 高 内 存 地 址 的 字 节 解释 为 整数 中 低位 
的 字 节 ， 这 种 字 节 序 称 为 big indian 序 。 因 此 ， 如 果 直 接 将 整数 的 本 机 表示 复制 后 发 送 给 目 
的 地 址 可 能 会 使 两 个 系统 对 同一 数据 包 的 理解 不 同 。 

因此 ，TCP/IP 协议 必须 规定 一 种 统一 的 字 节 序 ， 以 保证 各 种 不 同 的 计算 机 能 对 数据 包 
有 相同 的 理解 。TCP/IP 协议 规定 了 一 种 网 络 标准 字 节 序 来 表示 协议 中 各 种 数据 的 整 型 数 。 
这 样 主机 或 路 由 器 在 收 到 数据 包 时 应 现 将 其 中 的 整形 数字 段 的 网 络 序 转换 为 本 机 的 主机 序 
后 再 对 数据 包 进 行 处 理 ; 同样 ， 主 机 和 路 由 器 在 发 送 数据 包 之 前 应 先 将 数据 包 中 整形 数字 
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段 从 主机 序 转换 为 网 络 序 。 网 络 字 节 序 规定 整数 中 重要 的 位 必须 先 发 送 ， 也 即使 用 big 
indian 序 。 


3.3.2 IP 数据 包 


IP 协议 工作 的 对 象 是 数据 包 。 和 所 有 的 基于 数据 包 的 通信 协议 一 样 , IP 数据 包 也 由 包头 
和 数据 组 成 。 图 3.5 是 IP 数据 包 的 具体 格式 。 


0 4 8 16 19 24 31 


版 本 | 头 部 长 | ”服务 类 型 总 长 
标识 标志 片 偏 移 

Time To Live 协议 头 部 校 验 和 

RIP HH 

目的 IP 地 址 

全 选项 (如果 有 ) 
数据 
图 3.5 下 数据 包 格式 


数据 包 的 头 4 位 是 数据 包 格式 的 版 本 号 ， 当 前 的 他 版 本 号 为 4。 

头 部 长 字段 的 长 度 也 是 4 位, 它 标识 包头 的 长 度 。 这 里 的 度量 单位 是 32 位 。 从 图 3.5 中 
可 以 看 出 ，IP 包头 中 除了 IP 选项 字段 外 ， 其 他 的 字段 都 是 固定 的 。 常 用 的 他 包头 (不 包含 
IP 选项 字段 〉 的 长 度 是 20 个 8 位 字 。 因 此 头 部 长 字段 应 该 为 5。 

总 长 字段 给 出 了 整个 卫 数据 包 的 长 度 〈 以 8 位 字 计 ) ， 该 长 度 包括 包头 和 数据 包 数 据 。 
由 于 总 长 字段 只 有 16 位 ， 因 此 IP 数据 包 的 总 长 度 最 大 为 25-1 (65535) 个 8 位 字 。 

标识 、 标 志和 片 偏 移 字段 将 在 IP 数据 包 的 分 片 和 重组 中 说 明 。 

TTL (Time To Live) 字段 用 来 防止 IP 数据 包 永远 在 Internet 上 。 网 络 上 路 由 器 可 能 会 由 
于 某 种 原因 导致 路 由 表 出 错 。 这样 可 能 导致 卫 数据 包 永远 在 一 个 环 中 发 送 , 并 最 终 导致 网 络 
中 游荡 的 IP 数据 包 越 来 越 多 ， 并 最 终 导 致 网 络 崩 溃 。TTL 可 以 保证 路 由 器 出 错时 数据 包 也 
不 会 永远 在 网 络 中 游荡 。 主 机 在 发 送 IP 数据 包 到 网 络 上 时 会 设置 一 个 TTL 的 值 。 因 为 该 字 
段 只 有 8 位 ， 所 以 可 能 的 最 大 值 是 2355。 路 由 器 转发 卫 数据 包 时 至 少 要 将 TTL 的 值 减 1。 如 
果 路 由 器 处 理 速度 很 慢 ， 它 可 以 将 TTL 减少 该 他 数据 包 在 该 路 由 器 上 和 暂 存 的 秒 数 。 当 TTL 
变 为 0 时 ， 路 由 器 会 将 该 数据 包 丢 弃 并 发 送 一 个 错误 消息 给 数据 包 的 源 地 址 。 这 样 一 个 IP 
数据 包 在 经 过 最 多 255 个 路 由 器 后 会 最 终 消失 。 这 就 保证 了 整个 网 络 不 会 因 某 些 局 部 错误 和 
故障 而 全 部 瘫痪 。 

协议 字段 标识 IP 数据 包 中 的 数据 来 自 源 地 址 的 上 层 哪 一 个 协议 或 应 交 给 目标 地 址 的 哪 
个 上 层 协 议 处 理 ， 如 UDP、TCP 等 。 

头 校 验 和 字段 是 为 了 保证 IP 数据 包头 部 的 完整 性 。 其 计算 方法 是 : 计算 之 前 先 将 头 校 验 
和 字段 设 为 0， 然 后 将 他 头 部 分 为 多 个 16 位 字 (网络 序 ) 。 然 后 对 这 些 16 位 字 进 行 二 进 制 
反 码 求 和 。 计 算 结 果 存 在 头 校 验 和 字段 。 接 收 到 一 个 IP 数据 包 时 ， 要 重新 计算 头 部 校 验 和 ， 
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并 与 收 到 数据 包 的 头 部 校 验 和 进行 比较 。 如 果 两 个 校 验 和 不 相同 则 标识 传输 中 出 现 了 错误 ， 
IP 协议 就 丢弃 该 数据 包 。 需 要 说 明 的 是 ， 卫 协议 仅 计算 IP 包头 的 校 验 和 ， 而 不 计算 数据 区 
的 校 验 和 。 这 样 做 是 为 了 减少 路 由 器 的 计算 量 ， 同 时 也 让 上 层 协议 可 以 为 数据 提供 自己 的 校 
验 和 计算 方法 。 

了 P 选项 字段 放 在 后 面 说 明 。 


3.3.3 ”服务 类 型 


服务 类 型 字段 的 长 度 为 8 位 ， 这 8 位 指定 了 对 该 他 数据 包 的 处 理 方式 。 图 3.6 是 服务 类 
型 字段 的 组 成 格式 。 


优先 权 D|T|R|cCc | 保留 
图 3.6 服务 类 型 字段 结构 


前 三 位 是 一 个 优先 权 字段 ， 用 来 指定 数据 包 的 重要 程度 ， 但 现在 已 被 忽略 ,。D、T、R、 
C 四 位 分 别 代表 最 小 延 时 、 最 大 吞吐 量 、 最 高 可 靠 性 和 最 小 费用 。 这 四 位 要 么 都 设 为 0， 最 
多 设置 其 中 一 位 为 1。 需 要 注意 的 是 ， 设 置 这 四 个 标志 位 只 是 让 路 由 器 尽 可 能 地 按照 数据 包 
的 性 质 提 供 相应 的 传输 质量 ,这 并 不 保证 要 求 的 传输 质量 能 够 得 到 满足 ， 因 为 IP 协议 只 是 一 
种 提供 最 好 服务 的 协议 ， 而 这 些 传输 质量 的 满足 还 需要 依赖 硬件 条 件 等 许多 其 他 因素 。 


3.84 IP 数据 包 的 分 片 与 重组 


IP 包头 中 有 一 个 总 长 字段 ， 该 字段 能 表示 的 最 大 值 为 65 535， 因 此 IP 数据 包 的 最 大 长 
度 应 该 为 65 535 个 8 位 字 。 通 常 ， 这 个 限制 不 会 给 上 层 应 用 带 来 问题 。 但 在 实际 的 应 用 中 ， 
却 有 另外 一 个 长 度 限制 ， 使 得 TP 数据 包 的 长 度 无 法 达到 这 个 值 。 

我 们 先 通过 IP 数据 包 的 实际 传输 过 程 来 说 明 这 个 问题 。 因 为 IP 协议 的 目的 是 要 向 上 层 
屏蔽 下 层 物理 网 络 的 差异 , 它 能 够 在 不 同 的 物理 层 网 络 上 实现 。 但 IP 数据 包 的 传输 最 终 还 是 
要 依赖 底层 物理 网 络 的 传输 功能 的 .这 是 通过 将 P 数据 包 作为 数据 段 封装 在 物理 链 路 层 的 数 
据 帧 中 实现 的 。 图 3.7 说 明了 这 种 封装 。 


IP 报 头 了 P 报 文 数据 区 


| | 


帧 头 帧 数据 区 
3.7 四 数 据 包 在 数据 帧 中 的 封装 


在 很 多 物理 网 络 中 , 都 对 数据 帧 的 长 度 有 限制 ,而 且 这 个 限制 大 都 比 IP 数据 包 长度 的 限 
制 小 物理 网 络 的 这 个 限制 (对 帧 数据 区 ) 通 常 都 称 为 最 大 传输 单元 (MTU, Maximum Transfer 
Unit) 。 例 如 ， 以 太 网 的 MTU 为 1500 个 8 位 字 。 因 此 ， 如 果 了 王 数 据 包 的 长 度 大 于 物理 层 的 
MTU， 那 这 个 数据 包 是 不 能 封装 在 一 个 数据 帧 中 的 。 而 由 于 IP 协议 的 目的 是 为 了 向 上 层 屏 
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蔽 各 物理 网 络 的 差异 ， 因 此 它 不 能 将 这 个 限制 强加 给 上 层 协 议 。 

为 了 解决 该 问题 ， 卫 协议 使 用 了 分 片 与 重组 的 策略 。 这 种 策略 的 原理 就 是 如 果 一 个 IP 
数据 包 无 法 封装 在 一 个 数据 帧 中 ， 就 将 数据 包 分 成 几 个 长 度 小 于 MTU 的 片 ， 将 片 封 装 在 帧 
中 进行 传输 。 当 这 些 分 解 的 片 都 传输 到 目的 地 后 ， 再 将 这 些 片 重新 组 合成 原来 的 IP 数据 包 。 
分 片 动作 经 常会 在 路 由 器 上 发 生 。 因 为 路 由 器 很 可 能 同时 连接 在 两 种 不 同性 质 的 物理 网 络 上 
(如 以 太 网 和 ATM) ， 这 两 种 网 络 的 MTU 很 可 能 是 不 同 的 。 当 一 个 他 数据 包 从 MTU 大 的 
网 络 发 往 MTU 小 的 网 络 时 ， 卫 数据 包 往往 就 在 路 由 器 上 进行 分 片 。 需 要 说 明 的 是 ，IP 数据 
包 的 分 片 可 能 在 IP 数据 包 的 源 主机 和 网 络 路 由 器 上 发 生 , 但 重组 只 能 在 目标 主机 中 进行 。 我 
们 在 后 面 会 解释 。 下 面具 体 介 绍 这 种 分 片 与 重组 机 制 。 

为 了 说 明 这 种 机 制 ， 列 举 一 个 例子 ， 并 以 这 个 例子 为 基础 来 进行 说 明 。 图 3.8 是 一 个 网 
络 环境 的 示意 图 。 


网 络 A: 以 太 网 Aa um. 
RA 网 RB 


ail MTU = 720 E 


图 3.8 网 络 环境 示例 


在 图 3.8 中 , 网 络 A 和 网 络 B 都 是 以 太 网 , MTU-1500. 两 个 网 络 之 间 通 过 网 络 C 相连 ， 
网 络 C 的 MTU=720。 现 在 假设 网 络 A 的 主机 Hl 要 发 送 一 个 IP 数据 包 给 网 络 B 的 主机 
H2， 这 个 数据 包 的 数据 长 1300B。 AA IP 数据 包 的 总 长 应 该 是 1520 个 8 位 字 , 格式 如 图 3.9 
所 示 。 


4 5 TOS 1520 
7548 0 0 
TIL 协议 头 部 校 验 和 
HI 
H2 


Jen = 1500 


图 3.9 HI 发 给 H2 的 全数 据 包 


由 于 这 个 数据 包 的 长 度 大 于 网 络 A 的 MTU， 所 以 HI 的 IP 协议 需要 将 其 分 片 后 才能 封 
装 在 帧 中 。 卫 数据 包 对 数据 包 进行 分 片 时 ， 每 一 个 分 片 都 会 独立 地 成 为 一 个 IP 数据 包 。 
3.10 是 图 3.9 的 数据 包 分 片 后 的 两 个 数据 包 P1 和 P2 的 格式 。 

分 片 后 的 数据 包 都 有 自己 的 IP 包头 和 数据 区 ， 因 此 它们 发 送 到 路 由 器 A 后 是 作为 两 个 
独立 的 IP 数据 包 处 理 的 。 从 图 3.10 可 以 看 出 ， 分 片 的 数据 包头 中 大 部 分 字段 是 复制 源 数据 
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包头 的 复制 。 有 几 个 字段 需要 注意 。 首 先是 数据 包 总 长 字段 ， 因 为 分 片 后 两 个 数据 包 的 数据 
长 分 别 是 1480 和 20 个 8 位 字 ， 所 以 数据 包 IP] 的 长 度 是 1500， 刚 好 是 网 络 A 的 MTU， 数 
据 包 IP2 的 长 度 是 40. 两 个 数据 包 的 标识 字段 的 值 都 是 7548. 标识 字段 的 值 是 由 数据 包 的 源 
主机 Hi 决定 的 。 数 据 包 标识 决定 后 ， 对 该 数据 包 的 分 片 都 会 使 用 该 字段 的 值 。 这 样 在 目的 
地 址 主机 上 就 可 以 根据 标识 字段 识别 哪些 TP. 数据 包 是 同一 个 原 IP 数据 包 的 分 片 ， 以 便 进行 
重组 。 在 Hl 上 通常 是 通过 维护 一 个 全 局 变量 来 设置 数据 包 标 识 ， 每 产生 一 个 原 IP 数据 包 就 
将 该 变量 加 1。 在 他 包头 中 ， 标 志 字 段 由 3 位 组 成 。 前 两 位 一 般 不 使 用 ， 通 常 都 设 为 0。 最 
后 一 位 是 结束 分 片 标志 , 标识 该 数据 包 是 否 是 原 TP 数据 包 的 最 后 一 个 分 片 , 如 果 设 为 1 则 表 
示 该 数据 包 之 后 还 有 原 数 据 包 的 分 片 ， 如 果 设 为 0 则 标识 该 数据 包 是 原 数据 包 的 最 后 一 个 分 
片 。 从 图 3.10 可 以 看 出 ，IP1 之 后 还 有 分 片 ， 而 IP2 是 最 后 一 个 分 片 。 片 偏 移 字段 的 值 表示 
该 分 片 的 数据 相对 原 卫 数据 包 的 数据 的 偏 移 量 ， 该 偏 移 量 从 0 开始 计算 。 因 为 了 1 是 原 IP 
数据 包 的 第 一 个 分 片 ， 所 以 它 的 片 偏 移 为 0, 而 IP2 的 数据 是 原 TP 数据 包 数 据 的 1481 一 1500 
的 数据 ， 所 以 它 的 片 偏 移 是 1480。 在 数据 包 的 目的 地 址 主机 上 ， 可 以 根据 标志 字段 和 片 偏 移 
字段 判断 一 个 IP 数据 包 是 否 已 被 分 片 ， 是 否 是 原 TP 的 最 后 分 片 。 表 3.2 说 明了 判断 规则 。 


0 4 8 16 19 24 31 


4 5 TOS 1500 
7548 1 0 
TIL 协议 头 部 校 验 和 
报 文 IP1 
H2 
数据 … 
Jen 1480 
0 4 8 16 19 24 31 
4 5 TOS 40 
7548 0 1480 
TIL 协议 头 部 校 验 和 
报 文 IP2 Hi 
H2 
数据 … 
Jen=20 
图 3.10 分 片 后 的 两 个 数据 包 格 式 
表 3.2 目标 主机 判断 IP 数 据 包 分 片 情况 方法 
标 志 位 so m 


最 后 位 为 1 
最 后 位 为 0 
最 后 位 为 0 


已 分 片 ， 该 数据 包 不 是 最 后 分 片 
未 分 片 ， 该 数据 包 是 完整 数据 包 
已 分 片 ， 该 数据 包 是 最 后 分 片 


通过 以 上 说 明 可 以 看 出 如 何在 目标 主机 上 对 IP 数据 包 进 行 重组 . 首先 , 主机 收 到 数据 包 
后 先 判断 该 数据 包 是 否 已 被 分 片 , 如 未 分 片 则 直接 交 给 上 层 协 议 处 理 TP 数据 包 中 的 数据 。 如 
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果 数 据 包 已 分 片 则 根据 标识 字段 将 分 片 进 行 分 组 ， 同 标识 的 分 片 再 根据 片 偏 移 重新 组 合成 新 
的 数据 。 如 果 收 到 的 片 是 原 IP 数据 包 的 最 后 分 片 ， 则 表示 这 是 原 数据 包 数 据 的 结束 。 如 果 一 
个 原 IP 数据 包 的 所 有 分 片 在 它 的 第 一 个 分 片 到 达 后 在 一 定 的 时 间 内 都 到 达 ， 则 可 以 完成 IP 
数据 包 的 重组 了 。 如 果 超 过 该 时 间 ， 主 机 会 将 该 数据 包 的 所 有 分 片 都 丢弃 。 因 此 ， 卫 数据 包 
分 片 的 机 制 增加 了 IP 数据 包 传 输 失败 的 概率 , 因为 其 中 任何 一 个 分 片 传输 失败 都 意味 着 整个 
数据 包 传 输 的 失败 。 

H1 将 IPLA IP2 发 送 给 路 由 器 RA 之 后 , RA 还 要 对 IP 进行 分 片 以 适应 网 络 C 的 MTU, 
分 片 结果 如 图 3.11 所 示 。 


4 5 TOS 720 
7548 1 0 
TIL 
— 协议 头 部 校 验 和 
Hl 
H2 
数据 … 
len = 700 
0 4 8 16 19 24 31 
4 5 TOS 720 
7548 1 700 
TIL 3 
— 协议 头 部 校 验 和 
H1 
H2 
数据 … 
Jen = 71 
0 4 8 16 19 24 31 
4 5 TOS 100 
7548 1 1400 
TIL i 
ues 协议 头 部 校 验 和 
H1 
H2 
数据 … 
Jen = 80 


图 3.11 RA 对 了 Pl 的 分 片 


在 对 已 经 是 分 片 的 IP 数据 包 进行 分 片 时 有 几 点 需要 注意 。 首 先是 标志 位 的 设置 ， 如 果 
IP 数据 包 的 标志 位 为 1， 那 么 再 分 片 后 的 标志 位 都 为 1; 如果 IP 数据 包 的 标志 位 为 0， 那么 
再 分 片 后 的 分 片 中 最 后 的 分 片 的 标志 位 为 0， 其 他 的 都 为 1。 其 次 ， 对 片 偏 移 字 段 的 设置 ， 
其 值 应 该 是 在 TP 数据 包 的 片 偏 移 的 基础 上 的 偏 移 。 例 如 ， 如 果 需 要 对 IP2 进行 再 分 片 ， 那 么 
分 片 中 的 第 一 片 的 片 偏 移 应 该 是 1480， 而 不 是 0。 

我 们 再 来 看 为 什么 IP 数据 包 被 分 片 后 只 能 在 目标 主机 上 进行 重组 而 不 在 路 由 器 上 进行 
重组 。 在 路 由 器 上 进行 重组 的 优点 是 可 以 很 好 地 适应 不 同 物理 网 络 的 MTU。 例如， 在 图 3.8 
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中 路 由 器 RB 和 RD 在 收 到 MTU 为 720 的 网 络 C 的 数据 包 后 可 以 将 数据 包 重 新 组 成 更 大 的 
数据 包 ， 这 样 多 个 分 片 可 以 通过 一 个 重组 后 的 数据 包 发 送 到 目标 主机 H2， 效 率 更 高 ， 且 减 
小 了 失败 的 可 能 性 。 但 我 们 应 该 知道 路 由 器 处 理 IP 数据 包 的 方式 。 路 由 器 在 收 到 一 个 全 数 
据 包 后 就 会 根据 数据 包 的 目标 地 址 从 路 由 表 中 查找 应 该 将 数据 包 发 往 何 处 。 因 为 路 由 器 是 网 
络 的 核心 , 它 处 理 的 数据 包 数 量 是 非常 大 的 。 而 重组 IP 数据 包 时 需要 根据 源 地 址 和 数据 包 标 
识 将 数据 包 的 分 片 进行 暂时 保存 。 如 果 通 过 路 由 器 的 主机 数量 很 多 ， 主 机 的 通信 量 很 大 ， 那 
么 这 些 分 片 可 能 很 快 就 占有 了 路 由 器 的 全 部 存储 空间 。 

而 让 所 有 的 数据 包 都 在 目标 主机 进行 重组 虽然 可 能 会 导致 最 后 会 有 很 多 的 小 的 分 片 在 
MTU 很 大 的 网 络 传输 ， 浪 费 了 网 络 带宽 ， 但 这 样 做 有 几 个 很 大 的 好 处 。 首 先 ， 这 样 做 减轻 
了 路 由 器 的 负担 ; 其 次 ， 这 样 做 可 以 让 不 同 的 分 片 通过 不 同 的 路 由 到 达 目 的 地 址 。 上 例 中 的 
分 片 可 能 是 通过 如 图 3.12 的 方式 到 达 H2 的 。 


Baers 网 络 B， 以 太 网 
Pi, Pr IP11, API2. 
B RA | Bymz — Msc 12 到 | pp i we 


gh MTU - 720 m2 


IP11, IPI3 


图 3.12 分 片 的 路 由 


这 样 既 有 利于 路 由 器 之 间 的 负载 平衡 ， 也 有 利于 提高 网 络 的 可 靠 性 ， 因 为 在 有 元 余 的 网 
络 中 ， 分 片 可 以 在 某 条 链 路 故障 时 从 其 他 链 路 到 达 目 标 地 址 。 


3.3.5 IP 选项 


IP 选项 字段 是 可 选 字段 。 该 字段 主要 是 用 来 进行 网 络 调试 用 的 ， 但 因为 它 是 整个 IP 协 
议 的 一 部 分 ， 所 以 所 有 的 IP 协议 的 实现 中 都 必须 实现 对 IP 选项 的 处 理 。 

了 P 选项 字段 的 长 度 是 不 定 的， 根据 使 用 的 选项 不 同 而 不 同 。 有 的 选项 只 含有 一 个 8 位 字 
长 的 选项 码 , 有 的 则 除了 选项 码 外 还 含有 变 长 的 选项 数据 .因为 P 选项 字段 的 长 度 是 不 定 的 ， 
它 的 长 度 很 可 能 不 是 32 的 整数 倍 。 但 应 该 记得 头 部 长 字段 的 值 是 以 32 位 为 单位 的 。 所 以 ， 
如 果 了 王选 项 字段 的 长 度 不 是 32 的 整数 倍 ， 就 必须 在 其 后 补充 若干 位 让 其 与 选项 字段 的 长 度 
总 和 为 32 的 整数 倍 。 这 些 补 充 位 须 用 0 填充 。 

不 管 是 什么 选项 ， 都 以 一 个 8 位 字 长 的 选项 码 开 始 。 选 项 码 的 组 成 如 图 3.13 所 示 。 


$ 4. 2 3. 4 5 € ł 
复制 | 选项 类 选项 号 


图 3.13 ”选项 码 的 结构 
选项 码 由 三 部 分 组 成 : 复制 标志 位 、 选 项 类 和 选项 号 。 其 中 ， 复 制 标志 位 是 用 来 指示 对 


IP 数据 包 进行 分 片 时 对 该 选项 的 处 理 方式 。 将 该 标志 位 设 为 1 表示 将 IP 数据 包 分 片 时 应 该 
将 该 选项 复制 到 各 个 分 片 中 ; 将 该 标志 位 设 位 0 表示 将 IP 数据 包 分 片 时 只 需 将 该 选项 复制 到 
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第 一 个 分 片 中 。 选 项 类 用 来 表示 该 选项 所 属 的 类 别 。 总 共有 四 种 类 别 ， 其 中 类 别 1 和 3 被 保 
留 。 类 别 0 是 数据 包 和 网 络 控制 选项 ， 类 别 2 是 调试 和 测量 选项 。 选 项 号 用 来 区 别 不 同 的 选 
项 。 现 已 定义 的 各 选项 中 大 部 分 是 属于 类 别 0 的 选项 ， 即 是 用 来 进行 数据 包 和 网 络 控制 的 。 
下 面 介绍 几 种 常用 的 选项 。 


3.3.5.1 记录 路 由 选项 


记录 路 由 选项 可 以 用 来 记录 IP 数据 包 从 源 地 址 到 目的 地 址 所 经 过 的 路 由 器 记录 路 由 选 
项 的 结构 如 图 3.14 所 示 。 


0 8 16 24 31 
选项 码 (7) 长 度 指针 
于 地 址 1 
了 地址 2 


图 3.14 ”记录 路 由 选项 结构 


使 用 记录 路 由 选项 的 他 数据 包 的 处 理 过 程 如 下 : 首先 源 地 址 主机 决定 需要 记录 的 路 由 器 
CIP 地 址 ) 的 个 数 ， 并 分 配 好 空间 。 将 长 度 字段 设置 为 IP 地 址 的 个 数 乘 以 4 并 加 上 3， 指 针 
设置 为 4。 路 由 器 转发 数据 包 时 ， 如 果 数 据 包 包含 了 记录 路 由 选项 ， 路 由 器 就 将 指针 和 长 度 
进行 比较 以 检查 是 否 选项 的 TP 地 址 表 已 满 。 如 果 IP 地 址 表 已 满 ， 路 由 器 就 简单 地 将 数据 包 
发 送出 去 ; 如 果 长 度 大 于 指针 , 路 由 器 就 将 自己 的 TP 地 址 填 入 到 指针 所 指 的 位 置 并 将 指针 值 
加 4。 数据 包 到 达 目 标 主机 后 ， 目 标 主机 就 可 以 从 TP 地 址 表 中 将 IP 地 址 去 除 进行 处 理 了 。 
但 需要 注意 的 是 ， 通 常 目标 主机 会 忽略 记录 路 由 选项 。 要 使 用 记录 路 由 选项 需要 源 地 址 
主机 和 目标 主机 进行 配合 。 源 地 址 主机 发 送 IP 数据 包 时 需要 设置 记录 路 由 选项 , 而 目标 主机 
需要 对 记录 路 由 选项 进行 处 理 。 还 需要 注意 的 一 点 是 ， 记 录 路 由 选项 的 长 度 总 无 法 是 32 位 
的 整数 倍 。 


3.3.5.2 源 路 由 选项 


源 路 由 选项 的 作用 是 用 来 调试 网 络 ， 它 让 源 地 址 主机 有 能 力 确定 TP 数据 包 转 发 的 路 径 ， 
以 确定 该 路 径 中 的 网 络 是 否 工作 正常 。 源 路 由 选项 的 格式 和 记录 路 由 选项 相同 ， 只 是 选项 码 
不 同 。 源 路 由 选项 分 为 两 种 : 严格 源 路 由 〈strict source route) 和 松散 源 路 由 (loose source 
route) 。 

严格 源 路 由 选项 的 选项 码 为 137。 从 该 选项 码 可 以 看 出 它 的 复制 标志 位 为 1， 也 即 该 选 
项 需要 复制 到 数据 包 的 所 有 分 片 中 。 带 严格 路 由 选项 的 IP 数据 包 的 处 理 过 程 为 : 源 主机 确定 
要 经 过 的 网 络 的 地 址 列表 。 将 长 度 设置 为 人 P 地 址 的 个 数 乘 以 4 并 加 上 3, 并 将 指针 设置 为 4。 
严格 源 路 由 选项 要 求 数据 包 严 格 按照 TP 地 址 列表 进行 转发 ， 即 先 经 过 IP 地址 1， 再 经 过 IP 
地 址 2， 以 此 类 推 ， 且 中 间 不 得 经 过 任何 其 他 网 络 。 路 由 器 在 转发 带 严 格 源 路 由 选项 的 他 数 
据 包 时 ， 会 将 自己 的 网 络 IP 地 址 与 选项 中 指针 所 指 的 IP 地 址 对 比 ， 如 果 相 同 就 将 指针 加 4， 
表示 该 网 络 已 经 通过 。 如 果 路 由 器 找 不 到 符合 IP 地 址 的 网 络 将 该 数据 包 转发 , 它 就 会 发 送 一 
个 错误 消息 给 该 数据 包 的 源 主 机 。 数 据 包 到 达 目 标 主机 时 ， 指 针 的 值 应 该 大 于 长 度 的 值 。 

松散 源 路 由 选项 的 选项 码 为 131。 它 和 严格 源 路 由 选项 的 功能 相似 ， 所 不 同 的 是 它 只 要 
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求 数 据 包 能 按 顺 序 经 过 IP 地 址 表 所 指 的 网 络 ， 而 不 要 求 两 个 IP 地 址 将 不 经 过 其 他 网 络 。 
3.3.5.3 Of i] ik A 


时 间 堆 选项 的 功能 与 记录 路 由 选项 的 功能 类 似 , 但 它 还 能 记录 数据 包 经 过 相应 的 路 由 器 
的 时 间 。 时 间 戳 选项 的 结构 如 图 3.15 所 示 。 


0 8 16 24 31 
选项 码 (68) 长 度 指针 mh | 标志 
下 地 址 1 
时 间 稚 1 


图 3.15 ”时 间 稚 选项 的 结构 


长 度 和 指针 的 作用 与 记录 路 由 选项 的 相同 。 溢出 位 表示 应 为 选项 空间 已 满 而 无 法 进行 记 
录 的 路 由 器 的 数量 。 标 志 位 则 规定 了 路 由 器 对 选项 处 理 方式 的 不 同 。 下 面 根据 标志 位 的 不 同 
说 明 带 时 间 戳 选项 的 TP 数据 包 的 处 理 过 程 。 

标志 位 为 0 表示 在 选项 中 只 记录 时 间 戳 而 不 记录 IP 地 址 。 如 果 源 主机 将 时 间 戳 选项 的 标 
志 位 设 为 0， 路 由 器 在 转发 数据 包 时 如 果 检 查 指针 小 于 长 度 ， 就 将 当前 的 日 期 和 时 间 记 录 在 
指针 所 指 的 位 置 并 将 指针 加 4; 如果 列表 已 满 ， 即 指针 大 于 长 度 ， 则 将 溢出 值 加 1 。 

标志 位 为 1 表示 既 记录 IP 地 址 又 记录 时 间 戳 。 和 标志 位 为 0 的 处 理 不 同 的 是 , 如 果 列 表 
还 有 空间 ， 就 将 自己 的 IP 地 址 和 时 间 戳 一 起 写 入 指针 所 指 的 位 置 ， 并 将 指针 加 8。 

标志 为 3 表示 要 记录 的 IP 地 址 已 经 由 源 主机 确定 好 了 。 这 时 , 指针 和 溢出 字段 的 值 就 无 
效 了 。 路 由 器 转发 数据 包 时 ， 会 在 人 P 地 址 列表 中 查找 自己 的 TP 地址， 如果 找 到 就 将 当前 日 
期 和 时 间 记 录 在 该 他 地 址 之 后 ， 否 则 就 简单 将 数据 包 进行 转发 。 
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在 第 3 章 我 们 讲 过 , 要 将 一 个 IP 数据 包 传送 到 目的 地 , 必须 要 有 一 种 标识 目的 地 的 机 制 。 
这 种 机 制 就 是 IP Hhhb. IP 地 址 是 一 种 结构 化 的 二 进 制 地 址 ，IP 协议 能 够 通过 该 地 址 找到 与 
该 地 址 相关 联 的 主机 或 网 络 设备 ,在 第 3 章 中 也 讲 过 人 P 数据 包 的 实际 传输 是 通过 将 其 封装 在 
物理 网 络 的 数据 帧 中 并 让 底层 物理 网 络 来 传输 该 帧 来 实现 的 。 物 理 网 络 也 有 一 个 地 址 机 制 ， 
称 为 物理 地 址 。 物 理 网 络 就 是 通过 这 种 物理 地 址 来 进行 数据 帧 的 发 送 和 接收 的 。 这 时 就 出 现 
了 一 个 问题 ， 因 为 物理 网 络 是 无 法 识别 TP 地 址 的 , 当 IP 协议 将 数据 包 交 给 物理 网 络 发 送 时 ， 
物理 网 络 如 何 知道 该 数据 包 应 该 发 给 谁 呢 。ARP 协议 和 RARP 协议 就 是 用 来 解决 IP 地 址 和 
物理 地 址 间 的 映射 问题 的 。 在 本 章 中 ， 先 简单 介绍 物理 网 络 的 数据 帧 传输 机 制 ， 并 具体 说 明 
IP 地 址 和 物理 地 址 的 映射 问题 。 然 后 介绍 ARP 协议 ， 讨 论 它 如 何 将 一 个 他 地 址 映射 到 一 个 
与 它 相 关联 的 物理 地 址 。 最 后 介绍 RARP 协议 ， 该 协议 的 作用 与 ARP 协议 正好 相反 ， 它 是 
用 来 为 一 个 物理 地 址 关联 一 个 他 地 址 的 。 


4.1 IP 地址 和 物理 地 址 映射 问题 


在 本 节 中 , 我 们 以 以 太 网 为 例 , 说 明 物理 网 络 发 送 和 接收 数据 帧 的 原理 及 TP 地 址 到 物理 
地 址 的 映射 问题 。 还 将 讨论 对 这 个 问题 的 两 种 可 能 的 解决 办 法 。 


4.1.1. 以 太 网 的 传输 机 制 


以 太 网 是 一 种 广播 网 络 ， 即 连接 在 同一 个 以 太 网 中 的 任何 主机 都 能 接收 到 网 络 上 发 送 的 
所 有 数据 帧 。 但 主机 会 检查 数据 帧 中 的 目的 地 址 ， 如 果 该 数据 帧 不 是 发 给 自己 的 ， 就 会 将 其 
丢弃 。 因 此 连接 到 以 太 网 的 每 一 个 连接 口 〈 通 常 是 以 太 网 卡 ) 都 会 有 一 个 自己 惟一 的 以 太 网 
地 址 。 图 4.1 是 一 个 以 太 网 环境 示意 图 。 
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图 4.1 网 络 环境 示例 


在 图 4.1 中 有 两 个 以 太 网 ， 它 们 由 路 由 器 RT 相连 ， 且 两 个 以 太 网 上 的 主机 和 设备 都 支 
持 TCP/IP 协议 ， 所 以 两 个 网 络 之 间 的 主机 或 内 部 主机 之 间 都 能 通过 IP 协议 进行 通信 。 每 个 
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连接 到 网 络 的 接口 都 有 一 对 地 址 : 他 地址 (Pi) 和 物理 地 址 (Mi) 。 以 太 网 的 物理 地 址 也 称 
为 MAC 地 址 。 

首先 了 解 以 太 网 网 卡 的 MAC 地 址 机 制 。 每 个 以 太 网 卡 出 厂 时 都 会 有 一 个 固定 的 全 球 惟 
一 的 MAC 地 址 ， 这 样 就 保证 了 在 任何 一 个 以 太 网 内 都 不 会 有 重复 MAC 地 址 的 网 卡 出 现 。 
由 于 以 太 网 是 一 种 广播 网 ， 所 以 只 要 知道 目的 主机 网 卡 的 MAC 地 址 且 该 网 卡 已 连接 到 本 地 
主机 所 在 的 以 太 网 ， 就 可 以 发 送 一 个 目的 MAC 地 址 使 该 MAC 地 址 的 数据 帧 到 以 太 网 上 。 
目的 主机 的 网 卡 收 到 该 数据 帧 后 通过 检查 目的 MAC 地 址 发 现 该 数据 帧 是 发 送 给 自己 的 ， 就 
会 将 数据 帧 中 的 数据 区 (也 即 IP 数据 包 ) 交 给 上 层 协 议 OP 协议 ) 处 理 。 但 是 以 太 网 数据 
帧 是 无 法 广播 到 其 他 以 太 网 的 ， 如 在 图 4.1 中 H1 发 送 的 数据 帧 HB 是 无 法 收 到 的 。 

现在 来 看 不 同 主机 通过 IP 协议 通信 的 处 理 过 程 。 例 如 ， 图 4.1 中 主机 Hl BRIE—* IP 
数据 包 给 同 网 络 的 主机 HA. H1 的 他 协议 先 构造 一 个 他 数据 包 ， 将 其 目的 地 址 设 为 P4， 然 
后 将 该 数据 包 交 给 Hl 的 网 卡 处 理 , 并 指定 它 将 数据 包 发 往 M4, 网 卡 将 数据 包 封装 在 数据 帧 
的 数据 区 中 ， 并 将 数据 帧 的 目的 地 址 设置 为 M4， 然 后 将 数据 帧 发 送 到 网 络 上 。H4 的 网 卡 接 
收 到 数据 帧 后 发 现 该 帧 是 发 给 自己 的 , 就 将 帧 的 数据 区 提取 出 来 , 并 将 其 交 给 上 层 协议 处 理 ， 
这 就 完成 了 整个 数据 的 传输 过 程 。 如 果 是 不 同 网 络 的 主机 需要 通信 ， 例 如 Hl 需要 发 送 一 个 
IP 数据 包 给 HB， 其 过 程 是 不 一 样 的 。 首 先 Hl IP 协议 在 构造 好 IP 数据 包 后 就 将 其 交 给 
H1 的 网 卡 ， 并 让 其 将 发 送 到 MRa。 路 由 器 RT 连接 到 H1 所 在 以 太 网 的 网 卡 接收 到 发 送 给 自 
己 的 数据 帧 后 , 就 将 其 中 的 数据 交 给 上 层 IP 协议 处 理 。 RT 的 IP 协议 发 现 该 数据 包 是 发 送 给 
主机 HB 的 (因为 数据 包 的 目的 地 址 是 PB), 就 将 其 交 给 连接 到 HB 所 在 以 太 网 的 网 卡 处 理 ， 
并 让 其 将 数据 发 送 给 MB. HB 的 网 卡 接收 到 发 给 自己 的 数据 帧 后 就 将 帧 中 的 数据 交 给 上 层 
卫 协议 处 理 。 

从 上 述 的 通信 过 程 可 以 看 出 , IP 协议 将 数据 包 交 给 网 卡 处 理 时 必须 告诉 网 卡 将 数据 发 给 
哪个 MAC 地 址 。 也 就 是 说 ，IP 协议 在 发 送 数据 包 时 必须 知道 通过 哪个 MAC 地 址 才能 到 达 
目的 了 对 同一 个 以 太 网 中 的 主机 就 是 主机 网 卡 的 MAC 地 址 ， 否 则 就 是 相应 路 由 器 与 自己 
所 在 以 太 网 相连 的 网 卡 的 MAC 地址 ) 。 这 就 是 说 ，IP 协议 必须 有 一 张 表 ， 表 中 的 每 一 条 记 
录 都 说 明了 发 送 给 某 个 IP 地 址 的 数据 包 交 给 网 卡 处 理 时 , 应 让 其 发 送 到 一 个 相应 的 MAC 地 
址 。 这 张 表 的 产生 就 是 全 地 址 到 MAC 地 址 的 映射 过 程 。 


4.1.2 ”地 址 映射 的 可 选 解决 办 法 


要 将 外 地址 映射 到 一 个 能 用 来 与 其 通信 的 MAC 地 址 有 两 种 方法 : 

第 一 种 方法 就 是 人 工 建立 这 张 映射 表 ， 即 主机 或 设备 管理 员 来 设 定 这 张 表 。 用 这 种 方法 有 
几 个 很 难 克服 的 缺点 。 第 一 ， 管 理 员 必须 知道 一 个 以 太 网 中 所 有 网 卡 的 MAC 地 址 和 与 其 相关 
AY IP 地址， 对 于 其 他 以 太 网 的 IP 地 址 就 将 其 设 为 路 由 器 相关 网 卡 的 MAC 地 址 ; 第 二 ， 对 于 
新 出 现 的 IP 地 址 必须 手工 添加 一 条 记录 ; 第 三 ， 由 于 主机 的 网 卡 是 可 以 更 换 的 ， 那 相应 地 ， 
MAC 地 址 也 就 改变 了 , 但 IP 地址 可 以 不 变 (也 不 应 该 改变 ,因为 下 的 目的 就 是 要 屏蔽 物理 网 
络 ) 。 这 就 需要 一 一 更 改 该 以 太 网 中 所 有 主机 和 设备 的 映射 表 中 与 该 MAC 地 址 相关 的 记录 。 

第 二 种 方法 就 是 利用 以 太 网 是 广播 网 的 特性 ,让 主机 和 设备 之 间 相 互通 知 自己 的 了 P 地 址 
和 MAC 地址 的 对 应 关系 。 这 就 是 ARP. 协议 所 采用 的 方法 。 


第 4 章 ARP 和 RARP 


4.2 ARP 协 议 原理 


ARP 是 Address Resolution Protocol (地 址 解析 协议 ) 的 缩写 ， 它 是 用 来 查找 同一 个 物理 
网 络 中 与 一 个 也 地址 相关 联 的 物理 地 址 的 。 


4.2.1 ARP 协议 的 工作 原理 


ARP 协议 使 用 一 种 询问 /回答 机 制 。 我 们 以 图 4.1 中 的 网 络 环境 为 例 说 明 ARP 协议 的 工 
作 原 理 。 主 机 H1 要 发 送 一 个 卫 数据 包 给 主机 H4， 但 它 只 知道 H4 的 也 地 址 P4， 而 不 知道 
‘ERY MAC 地 址 。 整 个 卫 数据 包 的 发 送 过程 如 下 。 

H1 构造 好 IP 数据 包 , 但 这 时 还 不 能 将 其 交 给 网 卡 处 理 , 因为 它 不 知道 该 发 往 哪个 MAC 
地 址 。 这 时 H1 先 构造 一 个 ARP 请 求 数据 包 ， 该 数据 包 中 包含 了 IP 地 址 P4， 并 留 下 一 个 空 
位 表示 P4 的 MAC 地 址 。H1 的 ARP 协议 将 该 ARP 数据 包 交 给 网 卡 ， 让 它 将 该 ARP 数据 包 
作为 广播 帧 发 送出 去 。 这样 HT 所 在 以 太 网 中 的 所 有 网 卡 都 会 收 到 该 数据 帧 并 对 其 进行 处 理 ， 
因为 它 是 一 个 广播 帧 。 网 络 中 的 所 有 网 卡 在 收 到 该 广播 帧 后 会 将 帧 中 的 数据 取出 交 给 上 层 协 
议 CARP 协议 ) 处 理 。ARP 协议 在 收 到 这 个 请 求 数据 包 后 就 将 自己 的 IP 地址 与 数据 包 中 包 
TAN IP 进行 比较 ， 如 果 相 同 就 表示 对 方 在 询问 自己 的 MAC 地 址 。 如 果 发 现 不 是 询问 自己 的 
MAC 地 址 ，ARP 协议 会 简单 丢弃 该 数据 包 。 因 此 在 上 例 中 ， 只 有 H4 会 处 理 这 个 ARP 请 求 
数据 包 。 这 时 ，H4 会 将 自己 的 MAC 地 址 填 在 MAC 地 址 空位 上 ， 并 将 该 数据 包 改 为 ARP 
响应 数据 包 ， 然 后 让 网 卡 将 其 发 送 给 主机 HL。 地 址 解析 过 程 如 图 4.2 所 示 。 


H1 H4 RT PRb/MRb 
PIMI 4 PRaMRa 
H2 H3 HB 
Hl H4 RT PRb/MRb 
PLMI1 P4/M4 PRa/MRa 
P2/M2 P3M3 PB/MB 
H2 H3 HB 


图 4.2 ARP 询问 /回答 机 制 


需要 说 明 的 是 ，HIl 会 在 自己 发 送 的 ARP 数据 包 中 包含 自己 的 他 地 址 和 MAC 地 址 ， 这 
FÉ H4 在 向 P1 发 送 ARP 响应 数据 包 时 就 会 知道 让 网 卡 将 其 发 送 给 M1 。 
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对 于 不 在 同一 个 以 太 网 中 的 通信 ， 该 过 程 略 有 不 同 。 例 如 如 果 H 要 与 HB 通信 。 因 为 
H1 能 识别 PB 不 是 同一 个 以 太 网 中 的 他 地 址 (这 是 因为 他 地 址 是 一 种 结构 化 的 地 址 )，H1 
不 会 使 用 ARP 协议 询问 HB 的 MAC 地 址 。 因 为 HB 和 HI 不 在 同一 个 网 络 中 ，H1 知道 必须 
要 经 过 路 由 器 才能 将 数据 包 发 送 给 HB， 因 此 H1 会 将 IP 数据 包 发 送 给 路 由 器 RT。 如 果 HI 
不 知道 RT 的 MAC 地 址 MRa, 它 会 使 用 ARP 协议 询问 RT 的 MAC 地址。 同样 ，RT 在 转发 
数据 包 给 HB 时 ， 如 果 它 不 知道 HB 的 MAC 地 址 MB， 它 也 会 使 用 ARP 协议 进行 询问 。 从 
该 过 程 可 以 看 出 ，ARP 协议 只 能 在 同一 个 物理 网 络 中 使 用 , 不 属于 同一 个 物理 网 络 的 主机 永 
远 不 会 〈 也 不 用 ) 知道 对 方 的 MAC 地 址 。 

上 面 是 以 一 个 以 太 网 环境 为 例 说 明了 ARP 协议 的 工作 原理 。 事 实 上 ，ARP 可 用 来 将 任 
何 的 上 层 协 议 地 址 映射 到 任何 种 类 的 物理 地 址 。 


4.22 减少 地 址 解析 需要 的 通信 


如 果 每 次 发 送 一 个 耳 数 据 包 都 需要 进行 一 次 ARP 请 求 数据 包 的 广播 和 ARP 响应 数据 包 
的 发 送 , 那么 通信 发 送 一 个 人 P 数据 包 的 代价 是 非常 高 的 。 实际 上 ,可 以 使 用 一 些 措施 来 减少 
这 种 地 址 解析 所 需 的 通信 。 

如 果 计 算 机 通过 ARP 协议 发 现 了 一 个 IP 和 MAC 地 址 对 应 关系 ， 它 可 以 记 住 这 种 对 应 
关系 。 在 下 次 还 需要 往 这 个 IP RIE IP 数据 包 时 ， 就 知道 需要 发 往 哪个 物理 地 址 了 ， 而 不 用 
再 进行 ARP 询问 和 回答 了 。 这 通常 是 通过 在 系统 中 维护 一 个 ARP 缓存 实现 的 。 在 该 缓存 中 ， 
每 条 记录 都 有 3 个 选项 : IP 地 址 、 该 IP 相关 联 的 物理 地 址 和 该 记录 最 后 更 新 的 时 间 。 之 所 
以 需要 在 ARP 缓存 中 维护 一 个 更 新 时 间 字 段 ， 是 因为 计算 机 的 TP 地 址 或 物理 地 址 是 有 可 能 
会 改变 的 。 这 种 变化 可 能 需要 一 定 的 时 间 ， 因 此 每 过 一 定 的 时 间 ， 就 应 该 将 一 直 没 有 更 新 的 
记录 从 缓存 中 删除 。IP 协议 要 往 某 个 他 地 址 发 送 数据 包 时 ， 先 从 该 缓存 查找 该 他 对 应 的 物 
理 地 址 。 只 有 缓存 中 没有 该 了 P 的 对 应 物理 地 址 时 才 需 要 使 用 ARP 协议 进行 询问 。 当 ARP 协 
议 收 到 一 个 ARP 数据 包 (不管 是 请 求 数 据 包 还 是 响应 数据 包 ) 时 ， 它 可 以 从 中 提取 出 一 个 
IP 地 址 和 物理 地 址 的 对 应 关系 。 如 果 这 个 对 应 关系 已 经 在 缓存 中 ,， ARP 就 将 记录 的 最 后 更 新 
时 间 更 新 为 当前 时 间 。 如 果 缓存 中 没有 该 P 的 记录 , ARP 协议 就 添加 一 条 该 他 协议 的 记录 ， 
并 将 时 间 字 段 设 置 为 当前 时 间 。 

我 们 在 介绍 ARP 协议 的 原理 时 曾 说 过 ， 如 果 计 算 机 收 到 的 ARP 请 求 数据 包 不 是 询问 自 
己 的 物理 地 址 的 ， 它 会 将 这 个 ARP 数据 包 简 单 地 丢弃 。 这 种 说 法 是 不 准确 的 。 事 实 上 ， 计 
算 机 会 从 ARP 数据 包 中 将 数据 包 的 源 TP 地 址 和 源 物理 地 址 提取 出 来 , 并 用 它 来 更 新 ARP 组 
存 ， 因 为 这 个 ARP 请 求 数据 包 说 明了 这 个 IP 地 址 和 物理 地 址 之 间 的 对 应 关系 现在 还 是 正确 
的 。 如 果 随后 计算 机 要 与 该 了 P 地 址 通信 就 可 以 直接 从 ARP 缓存 中 查找 到 它 对 应 的 物理 地 址 
了 。 

另外 ， 计 算 机 在 启动 时 ， 可 以 向 网 络 发 送 一 个 ARP 响应 广播 报 ， 告 诉 网 络 中 的 所 有 计 
算 机 它 的 IP 地 址 和 物理 地 址 的 对 应 关系 。 这 样 做 是 因为 计算 机 可 能 是 在 更 换 网 卡 之 后 重启 
的 , 这 时 网 络 中 的 其 他 计算 机 中 可 能 还 保存 着 原来 的 IP 地 址 和 物理 地 址 的 对 应 关系 。 通 过 启 
动 时 的 广播 ARP 响应 数据 包 ， 可 以 让 这 些 计 算 机 及 时 将 对 应 关系 更 正 。 
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4.3 ARP 数据 包 格 式 


ARP 协议 的 数据 包 格式 如 图 4.3 所 示 。 
硬件 类 型 协议 类 型 
硬件 地 址 长 协议 地 址 长 操作 
发 送 者 物理 地 址 


发 送 者 协议 地 址 
目标 硬件 地 址 
目标 协议 地 址 


图 4.3 ARP 数据 包 格式 


ARP 数据 包 由 9 个 字段 构成 , 但 它 的 长 度 是 不 定 的 。 因 为 可 以 用 来 实现 任何 上 层 协 议 地 
址 到 任何 类 型 的 物理 地 址 的 映射 ， 而 不 同 的 地 址 类 型 其 长 度 是 不 同 的 ， 所 以 ARP 协议 的 长 
度 是 由 其 解析 的 地 址 的 类 型 决定 的 。 对 于 从 下 地址 到 以 太 网 MAC 地 址 的 映射 , IP 地 址 的 长 
度 是 4，MAC 地 址 的 长 度 是 6。 

硬件 类 型 字段 指明 了 物理 地 址 的 类 型 ， 对 于 以 太 网 ， 该 字段 为 1。 协议 类 型 字段 则 指明 
了 上 层 协议 地 址 的 类 型 ， 对 IP 协议 ， 该 字段 为 0x0800。 操 作 字 段 则 指明 了 ARP 数据 包 的 类 
型 ， ARP 请 求 数据 包 的 类 型 是 1; ARP 响应 数据 包 的 类 型 是 2; 3 和 4 用 来 表示 RARP 协议 
请 求 数据 包 和 响应 数据 包 , 因为 RARP 采用 了 和 ARP 同样 的 数据 包 格 式 。 我 们 在 4.4 节 介绍 
RARP 协议 。 

计算 机 在 发 送 ARP 请 求 数据 包 时 ， 会 将 自己 的 物理 地 址 和 IP 地 址 填写 在 发 送 者 硬件 地 
址 和 发 送 者 协议 地 址 字段 中 。 收 到 ARP 请 求 数 据 包 时 ， 会 将 发 送 者 硬件 地 址 和 发 送 者 协议 
地 址 提取 出 来 放 入 ARP 缓存 中 。 而 在 对 ARP 数据 包 进行 响应 时 ， 会 将 自己 的 硬件 地 址 和 协 
议 地 址 放 入 目标 硬件 地 址 和 目标 协议 地 址 字段 中 ， 并 将 目标 硬件 地 址 和 目标 协议 地 址 与 发 送 
者 硬件 地 址 和 发 送 者 协议 地 址 呼唤 ， 再 将 操作 字段 设 为 2。 


4.4 RARP 协议 


RARP 是 Reverse Address Resolution Protocol ( 反 向 地 址 解析 协议 ) 的 缩写 。RARP 协议 
起 到 了 为 物理 地 址 分 配对 应 的 IP 地 址 的 作用 。 

在 有 的 计算 机 系统 〈 如 无 盘 工 作 站 ) 中 没有 能 断 电 保存 数据 的 能 力 。 这 种 系统 的 启动 通 
常 是 通过 TCP/IP 文件 传输 协议 从 远程 服务 器 上 获取 启动 映像 文件 来 启动 计算 机 系统 的 。 但 
现在 出 现 了 一 个 问题 。 因 为 我 们 知道 ， 使 用 TCP/IP 进行 通信 必须 要 有 一 个 IP 地 址 。 还 知道 
网 卡 的 物理 地 址 是 固定 在 网 卡 上 的 , 而 IP 地 址 通常 是 保存 在 二 级 存储 器 中 并 在 系统 启动 后 载 
入 系统 的 。 因 为 需要 远程 启动 的 系统 往往 没有 二 级 存储 系统 , 因此 在 启动 之 前 是 没有 卫 地 址 
的 。 这 就 出 现 了 矛盾 : 系统 需要 使 用 TCP/IP 协议 来 启动 ， 但 使 用 TCP/IP 的 前 提 条 件 CIP Hh 
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址 ) 必须 在 启动 之 后 才 有 。 

RARP 协议 的 出 现 就 解决 了 这 个 矛盾 。RARP 协议 的 实现 分 为 客户 端 和 服务 器 两 部 分 。 
需要 远程 启动 的 系统 必须 将 RARP 协议 的 客户 端 固化 在 硬件 中 (如 ROM) ， 而 服务 器 端 并 
不 是 所 有 的 TCP/IP 的 实现 都 包含 了 RARP 协议 的 。TCP/IP 通常 是 作为 系统 的 核心 实现 的 ， 
而 RARP 服务 器 通常 是 作为 一 种 服务 提供 的 。 

RARP 协议 的 原理 很 简单 : 需要 知道 自己 IP 地 址 的 计算 机 发 送 一 个 RARP 请 求 数据 包 给 
RARP 服务 器 ， 服 务 器 向 该 计算 机 发 送 一 个 RARP 响应 数据 包 ， 响 应 数据 包 中 包含 了 请 求 计 
算 机 的 IP 地 址 。 请 求 计算 机 在 获得 了 自己 的 IP 地 址 之 后 就 可 以 用 它 来 与 文件 服务 器 通信 获 
取 自 己 的 启动 映像 文件 了 。 至 于 与 文件 服务 器 之 间 的 通信 机 制 细节 在 此 不 加 以 讨论 。 

RARP 数 据 包 的 格式 与 ARP 数 据 包 的 格式 相同 现在 来 详细 说 明 RARP 协 议 的 工作 ”过 
程 。 

请 求 计 算 机 构造 一 个 RARP 请 求 数据 包 。 在 该 数据 包 中 ,计算 机 将 发 送 者 硬件 地 址 和 目 
标 硬件 地 址 都 设 为 自己 的 物理 地 址 。 然 后 将 该 数据 包 广播 到 网 络 中 。 网 络 中 所 有 的 计算 机 都 
能 接收 到 该 数据 包 , 但 只 有 RARP 服务 器 会 处 理 。RARP 服务 器 将 请 求 计算 机 的 IP 地址 放 入 
数据 包 的 目标 协议 地 址 字段 中 ， 并 将 数据 包 类 型 改 为 4〈 响 应 ) 。 然 后 将 响应 数据 包 发 送 给 
请 求 计 算 机 。 

在 远程 启动 过 程 中 ，RARP 请 求 的 成 功 是 必 不 可 少 的 。 但 如 果 出 现 网 络 故障 或 RARP 服 
务 器 失效 时 , RARP 请 求 将 会 失败 。 通常 请 求 计算 机 对 这 种 情况 的 处 理 是 使 用 超时 重 发 机 制 。 
如 果 经 过 多 次 重 发 ， 系 统 机 会 向 用 户 报告 一 个 错误 。 因 为 在 局 域 网 中 网 络 故障 发 生 的 可 能 性 
比较 小 ， 但 服务 器 发 生 故 障 或 重新 启动 的 可 能 性 是 比较 大 的 。 所 以 为 了 保证 服务 器 失效 时 计 
算 机 能 正常 启动 ， 通 常 都 在 一 个 网 络 中 放置 多 个 RARP 服务 器 。 但 这 样 做 也 有 它 的 不 足 。 
为 所 有 的 RARP 服务 器 都 会 对 RARP 请 求 产生 响应 ， 这 就 会 造成 网 络 流量 的 增多 。 
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FAA IP 协议 是 提供 不 可 靠 传输 服务 的 ， 因 此 源 地 址 发 出 的 人 P 数据 包 很 可 能 无 法 到 达 目 
标 地 址 。 但 发 生 这 种 情况 的 原因 是 很 多 的 ， 可 能 是 目标 主机 根本 不 存在 ， 也 可 能 是 传输 途中 
的 某 个 链 路 中 断 等 。 那么 在 IP 数据 包 无 法 传送 到 目标 地 址 时 , 发 送 方 怎样 才能 知道 是 什么 原 
因 造 成 的 呢 ? ICMP 协议 就 是 用 来 探测 并 报告 TP 数据 包 传输 中 产生 的 各 种 错误 的 在 本 章 中 ， 
我 们 将 介绍 ICMP 协议 。 


5.1 ICMP 协议 的 作用 与 原理 


ICMP 是 Internet Control Message Protocol (互联 网 控制 消息 协议 ) 的 缩写 。ICMP 协议 
就 是 用 来 探测 并 报告 IP 数据 包 传输 中 产生 的 各 种 错误 的 。 

我 们 都 知道 IP 协议 的 工作 原理 。IP 数据 包 在 网 络 上 的 传输 是 通过 路 由 器 对 数据 包 的 转 
发 来 完成 的 。 如 果 在 IP 数据 包 的 传输 过 程 中 , 某 个 路 由 器 因为 某 种 原因 无 法 转发 收 到 的 数据 
包 时 ， 数 据 包 就 会 被 丢弃 。 但 这 时 数据 包 的 发 送 站 无 法 得 知 传输 出 错 ， 更 不 知道 出 错 的 具体 
原因 。 而 一 个 有 效 的 错误 检查 与 报告 机 制 对 TCP/IP 协议 是 非常 重要 的 ， 因 为 它 可 以 使 我 们 
在 网 络 发 生 故障 时 知道 故障 的 具体 原因 与 位 置 。 

ICMP 协议 就 是 这 样 一 种 能 让 我 们 对 网 络 进行 调试 的 报错 机 制 ， 它 能 让 发 现 错误 的 路 由 
器 向 数据 包 的 源 站 发 送 一 个 出 错 消息 ， 报 告 出 错 原 因 。 这 样 源 站 就 可 以 根据 不 同 的 错误 采取 
不 同 的 措施 进行 处 理 。 需 要 指出 的 是 ，ICMP 的 错误 报告 只 能 通知 出 错 数据 包 的 源 主机 ， 而 
无 法 通知 从 源 主 机 到 出 错 路 由 器 途中 的 所 有 路 由 器 。 例 如 : 在 图 5.1 中 主机 HI 向 H2 发 送 一 
AS IP BL, PR AE RC 发 现 该 数据 包 无 法 将 该 数据 包 转 发 到 2。 我 们 看 看 通过 RC 接收 
到 的 数据 包 能 提取 哪些 信息 。RC 能 知道 数据 包 的 源 地 址 和 目标 地 址 ， 但 它 无 法 知道 该 数据 
包 到 达 本 路 由 器 时 途中 经 过 了 哪些 其 他 的 路 由 器 。 因 此 RC 只 能 将 出 错 消 息 发 送 给 数据 包 的 
源 地 址 Hl. 


Hl RA H2 


RB RC 


= | 


图 5.1 于 数据 包 出 错 示 例 


从 图 5.1 中 还 可 以 看 出 ICMP 数据 包 应 该 如 何 传输 。 如 果 RC 要 向 HI 发 送 一 个 ICMP HK 
据 包 ， 那 么 该 数据 包 必须 通过 路 由 器 RA 或 RB， 即 要 由 它们 之 中 的 一 个 将 数据 包 转发 给 主 
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机 Hl。 但 路 由 器 只 会 转发 他 数据 包 ， 所 以 应 该 将 ICMP 数据 包 封装 在 IP 数据 包 中 才能 将 它 
传输 到 目的 地 。 事 实 上 ICMP 数据 包 确 实 是 封装 在 IP 数据 包 中 的 ， 如 图 5.2 所 示 。 


ICMP 数 据 报 


| | 


IPH: Tp 数据 区 
图 5.2 ICMP 数据 包 的 封装 


因为 ICMP 数据 包 是 封装 在 卫 数据 包 中 的 ， 因 此 ICMP 数据 包 的 传输 也 有 可 能 会 出 错 。 
这 时 就 需要 为 这 个 ICMP 数据 包产 生 另 一 个 ICMP 数据 包 ， 并 将 它 发 送 给 源 ICMP 数据 包 的 
源 路 由 器 。 在 一 个 已 经 很 繁忙 的 网 络 中 ，IP 数据 包 的 出 错 率 是 比较 高 的 ， 也 即 发 送 的 ICMP 
数据 包 比 较 多 ， 如 果 再 为 这 些 ICMP 数据 包产 生 新 的 ICMP 数据 包 ， 就 会 加 重 网 络 负载 。 使 
得 本 已 阻塞 的 网 络 阻 塞 得 更 严重 。 因 此 ICMP 协议 规定 ， 如果 传 输 ICMP 数据 包 的 IP 数据 包 
出 错 ， 不 能 为 该 数据 包产 生 新 的 ICMP 数据 包 。 


5.2 ICMP 数据 包 的 格式 


因为 传输 错误 的 种 类 多 种 多 样 ，ICMP 协议 要 报告 这 些 错误 就 必须 根据 不 同 的 错误 采用 
不 同 的 格式 。 但 各 种 CIMP 数据 包 都 有 一 个 共同 的 ICMP 头 部 。 图 5.3 说 明了 ICMP 数据 包 
的 头 部 格式 。 


类 型 代码 校 验 和 


数据 区 〈 不 同 的 ICMP 数 据 报 有 不 同 的 格式 和 长 度 ) 
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类 型 字段 定义 了 各 种 不 同 的 ICMP 数据 包 ， 不 同 的 ICMP 数据 包 起 到 不 同 的 作用 ， 也 有 
不 同 的 格式 。 表 5.1 是 已 定义 的 各 种 ICMP 类 型 。 


表 5.1 ICMP 数 据 包 类 型 

描 述 
回 显 (echo) 应 答 
目标 不 可 达 
源 端 关闭 
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续 表 
描述 

数据 包 参 数 错误 

时 间 惟 请求 

Ff (DAY 

信息 请 求 〈 作 废 ) 

信息 应 答 〈 作 废 ) 

地 址 掩 码 请 求 

地 址 掩 码 应 答 


虽然 大 多 的 ICMP 数据 包 都 是 用 来 报错 的 ， 但 有 的 是 用 作 探测 和 获取 信息 的 。 代 码 字段 
是 用 来 说 明 错误 的 具体 原因 的 ， 将 在 5.3 节 具 体 介 绍 各 种 ICMP 数据 包 时 详细 说 明 。 


5.3 各 种 ICMP 数据 包 


由 于 ICMP 数据 包 的 种 类 较 多 ， 在 本 节 将 按照 各 种 ICMP 数据 包 的 不 同 功能 分 小 节 对 其 
中 常见 的 几 种 进行 详细 说 明 。 


5.3.1 回 显 请 求 与 应 答 


回 显 请 求 和 应 答 数据 包 用 来 测试 从 发 送 主机 到 接收 主机 的 网 络 链 路 是 否 完好 以 及 目标 
主机 的 TCP/TP 协议 是 否 工 作 正 常 。 图 5.4 是 回 显 请 求 与 应 答 数据 包 的 格式 。 
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类 型 (8 或 0) 代码 (0) 校 验 和 
标识 序列 号 


可 选 数据 
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回 显 请 求 与 应 答 数据 包 的 代码 字段 都 必须 设 为 0。 可 选 数据 字段 是 一 个 变 长 的 字段 ， 发 
送 方 可 以 用 任何 数据 填充 该 字段 ， 当 然 ， 该 字段 的 长 度 也 可 以 为 0。 标 识 和 序列 号 字段 是 发 
送 方 用 来 匹配 请 求 数 据 包 和 应 答 数 据 包 的 。 回 显 请 求 与 应 答 的 工作 过 程 如 下 : 发 送 方 构造 一 
个 回 显 请 求 数据 包 ， 它 可 以 设置 任意 长 度 的 可 选 数据 字段 ， 其 中 可 以 随意 填写 数据 。 目 标 主 
机 收 到 该 数据 包 后 将 类 型 字段 改 为 0 再 发 送 给 请 求 数据 包 的 发 送 方 。 一 旦 请 求 发 送 方 接收 到 
请 求 数据 包 的 应 答 数据 包 ， 它 能 肯定 两 个 问题 : 首先 ， 从 发 送 方 到 接收 方 的 网 络 通路 工作 正 
常 ; 第 二 ， 目 标 主机 的 TCP/IP 协议 工作 正常 。 


5.3.2 目标 不 可 达 错 误 


当 一 个 路 由 器 无 法 将 一 个 卫 数据 包 转 发 到 目的 地 时 , 它 会 将 该 数据 包 丢 弃 , 但 同时 它 会 
向 该 数据 包 的 源 主机 发 送 一 个 目标 不 可 达 的 ICMP 数据 包 。 该 数据 包 起 到 了 报错 的 作用 。 
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ICMP 目标 不 可 达 数 据 包 的 格式 如 图 5.5 所 示 。 


0 8 16 24 31 
类 型 3) 代码 oa» | 校 验 和 
未 使 用 必须 为 0) 


了 报头 + 数据 报 的 头 64 位 


图 5.5 ICMP 目标 不 可 达 数 据 包 格式 


类 型 字段 为 3， 标 识 这 是 一 个 ICMP 目标 不 可 达 数 据 包 。 代 码 字段 的 值 进一步 说 明了 出 
错 的 具体 原因 ， 其 取 值 范围 为 0 一 12。 各 值 的 含义 如 表 5.2 所 示 。 


表 5.2 ICMP 目 标 不 可 达 数 据 包 代码 字段 值 


代 描述 


应 


网 络 不 可 达 

主机 不 可 达 

协议 不 可 达 

端口 不 可 达 

需要 分 片 ， 但 设置 了 DF 不 分 片 ) 位 
源 路 由 失败 

未 知 的 目标 网 络 

未 知 的 目标 主机 

源 主机 孤立 
禁止 与 目标 网 络 通信 
禁止 与 目标 主机 通信 

指定 服务 类 型 的 网 络 不 可 达 
指定 服务 类 型 的 主机 不 可 达 


= |= oo r wire [- 
ris je 3) |o fu [a ola 


S 


另外 我 们 注意 到 ICMP 目标 不 可 达 数 据 包 中 最 后 一 个 字段 , 该 字段 包含 了 出 错 他 数据 包 
AY IP SK BBA IP 数据 包 数 据 部 分 的 头 64 位 。 之 所 以 要 包含 这 个 字段 是 为 了 能 让 IP 数据 包 的 
发 送 者 知道 是 哪个 数据 包 出 错 。 


5.8.8 源 端 关闭 


路 由 器 转发 数据 包 时 是 仅仅 根据 单个 数据 包 的 信息 进行 转发 的 , 因此 它 无 法 为 某 个 数 
据 包 预 留 一 定 的 资源 。 由 于 路 由 器 的 资源 〈 内 存 ， 计 算 时 间 等 ) 是 有 限 的 ， 所 以 在 网 络 数据 
流量 比较 大 时 ， 路 由 器 为 了 转发 数据 包 可 能 会 耗 尽 其 所 有 资源 ， 这 种 情况 称 为 阻塞 。 出 现 阻 
塞 就 是 路 由 器 能 力 有 限 ， 无 法 转发 所 有 需要 转发 的 数据 包 。 这 时 路 由 器 会 选择 丢弃 一 些 数据 
包 。 但 仅仅 这 样 做 还 是 无 法 减轻 网 络 阻塞 的 情况 ， 因 为 发 送 端 在 发 出 数据 包 后 如 果 无 法 收 到 
响应 往往 会 发 送 更 多 的 数据 包 到 网 络 上 ， 使 得 网 络 更 加 拥挤 ， 使 网 络 的 阻塞 更 加 严重 。 因 此 
路 由 器 在 丢弃 数据 包 时 会 发 送 一 个 信息 到 数据 包 的 发 送 方 ， 通 知 它 网 络 已 阻塞 ， 请 组 发 数据 
包 。 用 来 发 送 这 个 通知 的 就 是 ICM 源 端 关 闭 数据 包 。 该 数据 包 格式 如 图 5.6 所 示 。 
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类 型 (4) 代码 (0) 校 验 和 


未 使 用 〈 必 须 为 0) “39 ) 


于 报头 + 数据 报 的 头 64 位 


图 5.6 ICMP 源 端 关闭 数据 包 格 式 


从 图 中 可 以 看 出 ，ICMP 源 端 关 闭 数据 包 的 格式 和 目标 不 可 达 数 据 包 格 式 相同 ， 只 是 类 
型 和 代码 字段 的 值 不 同 。ICMP 源 端 关闭 数据 包 也 在 最 后 一 个 字段 包含 了 被 丢弃 的 IP 数据 包 
的 IP 头 部 和 数据 部 分 的 头 64 位 。 


5.34 ”超时 错误 


在 亿 数 据 包 中 有 一 个 TTL 字段 , IP 数据 包 每 被 路 由 器 转发 一 次 该 字段 的 值 就 至 少 减 1。 
当 该 字段 的 值 减少 到 0 时 路 由 器 会 将 该 数据 包 丢弃 。 但 这 种 情况 是 很 少 发 生 的 , 因为 人 P 数据 
包 都 会 将 该 字段 的 值 设 置 的 足够 大 ， 使 得 该 数据 包 被 转发 到 目标 主机 时 该 字段 的 值 仍 然 大 于 
0。 但 有 时 也 会 发 生 这 种 情况 ， 例 如 几 个 路 由 器 组 成 一 个 环 ， 而 且 路 由 器 中 的 路 由 表 有 错误 ， 
这 时 在 其 中 转发 的 数据 包 可 能 一 直 在 这 个 环 中 直到 TTL 字段 减 为 0。 在 将 TTL 为 0 的 数据 包 
丢弃 之 前 ， 路 由 器 需要 通知 数据 包 的 源 主机 数据 包 转发 超时 了 。 

由 于 一 个 他 数据 包 在 转发 到 目标 主机 的 过 程 中 可 能 被 分 成 了 多 个 片 ,而 这 些 分 片 是 单独 
路 由 的 ,因此 很 有 可 能 一 个 亿 数据 包 的 多 个 分 片 只 有 部 分 能 到 达 目 标 主机 而 其 他 的 可 能 丢失 
了 。 目 标 主 机 在 对 一 个 了 P 数据 包 的 多 个 分 片 进行 重组 时 , 如 果 等 待 一 定 的 时 间 后 剩 下 的 分 片 
还 没有 到 达 ， 目 标 主机 就 认为 这 些 分 片 不 会 到 达 ， 并 将 已 收 到 的 分 片 丢弃 。 在 丢弃 这 些 分 片 
之 前 ， 目 标 主机 会 通知 源 主机 IP 数据 包 的 分 片 在 进行 重组 时 超时 了 。 

不 管 是 上 述 两 种 情况 的 哪 一 种 ， 路 由 器 和 目标 主机 都 是 通过 向 源 主机 发 送 一 个 ICMP 超 
时 数据 包 来 通知 它 的 。 该 数据 包 的 格式 如 图 5.7 所 示 。 
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类 型 (11) 代码 0 或 1) 校 验 和 
未 使 用 (必须 为 0) 


下 报头 + 数据 报 的 头 64 位 


图 5.7 ICMP 超时 数据 包 格 式 
其 中 代码 字段 说 明了 超时 的 具体 原因 。0 标识 TTL 值 减 为 0, 而 1 表示 分 片 重组 超时 了 。 


5.35 ”数据 包 参 数 问题 


如 果 路 由 器 或 主机 发 现 一 个 收 到 的 TP. 数据 包 的 格式 不 符合 要 求 , 它 就 会 向 源 主机 发 送 一 
个 报错 , 并 指出 数据 包 中 的 什么 字段 格式 或 值 不 正确 。 这 就 是 ICMP 参数 错误 数据 包 的 作用 ， 
该 数据 包 的 格式 如 图 5.8 所 示 。 

在 ICMP 参数 错误 数据 包 中 ,代码 字段 的 值 表示 了 IP 数据 包 格 式 错误 的 类 型 。 0 a IP 
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数据 包 中 头 部 某 个 字段 的 值 设 置 错误 , 这 时 指针 字段 的 值 就 表示 是 TP. 头 部 的 那个 八 位 字 的 值 
出 错 了 。 代 码 1 表示 IP 头 部 需要 设置 某 个 选项 但 没有 设置 ， 这 时 指针 字段 没有 意义 。 
0 8 16 24 3l 


类 型 02) 代码 (0 或 1) 校 验 和 
指针 未 使 用 (必须 为 0) 


下 报头 + 数据 报 的 头 64 位 
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5.3.6 ”获取 子 网 掩 码 


关于 子 网 掩 码 的 作用 与 原理 在 第 3 章 已 经 详细 讲述 过 。 现 在 的 问题 是 一 个 使 用 了 子 网 掩 
码 技术 网 络 中 的 主机 要 与 该 网 络 中 的 其 他 主机 或 者 与 该 网 络 外 面 的 主机 通信 必须 知道 该 网 
络 的 网 络 掩 码 。 在 常见 的 系统 中 ， 这 个 掩 码 是 可 以 认为 设置 的 ， 但 这 就 要 求 系 统管 理 人 员 知 
道 该 网 络 的 掩 码 。ICMP 可 以 自动 获取 网 络 使 用 的 子 网 掩 码 ， 这 是 通过 发 送 子 网 掩 码 请 求 数 
据 包 并 接收 响应 数据 包 实现 的 。 这 两 种 数据 包 的 格式 如 图 5.9 所 示 。 
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类 型 (17 或 18) 代码 (0) 校 验 和 
标识 序列 号 
地 址 掩 码 


图 5.9 ICMP 子 网 掩 码 请 求 与 响应 数据 包 


请 求 主机 可 以 向 路 由 器 或 者 直接 广播 该 数据 包 ， 路 由 器 会 将 网 络 的 子 网 掩 码 通知 给 该 
主机 。 


第 6 音 路 由 协议 


我 们 讲 到 P 协议 包 的 传输 时 提 到 当主 机 要 与 一 个 与 自己 不 在 同一 个 网 段 的 主机 通信 时 
它 往 往 是 先 将 数据 包 发 送 给 自己 所 在 网 络 中 的 路 由 器 ， 然 后 由 不 同 的 路 由 器 将 数据 包 转 发 到 
目标 主机 。 可 能 有 的 读者 会 很 疑惑 ， 路 由 器 怎么 知道 目标 主机 在 什么 地 方 ， 应 该 将 数据 包 往 
哪 转发 呢 ? 本 章 就 来 仔细 研究 这 个 问题 。 

通常 ， 在 配置 主机 系统 的 网 络 配置 时 使 用 的 都 是 静态 路 由 及 在 配置 接口 时 ， 以 默认 方式 
生成 路 由 表 项 〈 对 于 直接 连接 的 接口 ) ， 并 可 以 通过 命令 增加 表 项 〈 通 常 从 系统 自 引导 程序 
文件 ) ， 或 是 通过 ICMP 重 定向 生成 表 项 〈 通 常 是 在 默认 方式 出 错 的 情况 下 ) 。 在 网 络 很 小 ， 
且 与 其 他 网 络 只 有 单个 连接 点 且 没 有 多 余 路 由 时 〈 若 主 路 由 失败 ， 可 以 使 用 备用 路 由 ) ， 采 
用 这 种 方法 是 可 行 的 。 如 果 上 述 三 种 情况 不 能 全 部 满足 ， 通 常 使 用 动态 路 由 。 本 章 要 讨论 的 
路 由 协议 就 是 用 于 动态 路 由 的 ， 它 能 在 路 由 器 间 交 换 网 络 拓扑 结构 和 可 达 性 的 信息 。 

在 本 章 中 先 简单 介绍 路 由 器 的 工作 原理 ， 主 要 目的 是 看 看 路 由 器 要 正常 工作 需要 哪些 条 
件 ， 这 是 路 由 协议 的 目标 ， 然 后 具体 讲述 几 种 常见 的 路 由 协议 。 


6.1 路 由 器 的 工作 原理 及 路 由 协议 


路 由 器 的 作用 就 是 在 不 同 的 网 络 之 间 转 发 PP 数据 包 ， 使 得 该 P 数据 包 能 够 正确 地 、 尽 
量 快 地 到 达 它 的 目的 地 。 那 么 路 由 器 具体 是 如 何 进行 数据 包 的 转发 的 呢 ? 为 什么 需要 有 路 由 
协议 呢 ? 本 节 将 详细 说 明 这 些 问 题 的 答案 。 


6.1.1 路 由 器 的 工作 原理 


图 6.1 说 明了 路 由 的 工作 方式 和 作用 。 

在 图 中 路 由 器 Ra 有 4 个 端口 连接 4 个 不 同 的 的 网 络 ,路 由 器 Rb 连接 了 2 个 不 同 的 网 络 ， 
而 路 由 器 Ra 和 Rb 之 间 是 通过 一 个 共同 的 网 络 相 连 的 。 现 在 有 一 个 IP 数据 包 从 Ra 的 左 侧 的 
端口 进入 路 由 器 ,该 数据 包 的 目的 地 址 是 202.119.15.137。 因 为 Ra 的 下 面 的 端口 连接 到 了 网 
络 202.119.15.0/24， 所 以 Ra 直到 主机 202.119.15.137 是 直接 连接 到 该 路 由 器 的 ， 所 以 它 将 该 
数据 包 直接 转发 给 了 目的 地 址 。 又 有 一 个 数据 包 从 上 面 的 端口 到 达 路 由 器 Ra, 其 目的 地 址 是 
202.119.12.24。 这 时 ， 路 由 器 要 将 该 数据 包 转 发 进行 正确 的 转发 它 就 必须 知道 要 通过 路 由 器 
Rb 才能 到 达 目的 地 。 我 们 现在 不 管 Ra 是 如 何 知 道 这 一 点 的 ， 假 设 它 已 经 知道 要 到 达 网 络 
202.119.12.0/24 就 必须 通过 路 由 器 Rb. KM, Ra 会 将 该 数据 包 通 过 右边 的 端口 转发 给 路 由 
器 Rb。Rb 在 收 到 该 数据 包 后 再 将 它 从 右边 端口 转发 给 目的 地 址 202.119.12.24。 

这 就 是 路 由 器 大 致 的 工作 过 程 。 现 在 来 看 看 路 由 器 实现 这 种 功能 的 具体 机 制 。 

路 由 器 收 到 一 个 数据 包 时 ， 必 须要 能 确定 应 该 从 哪个 端口 将 该 数据 包 转 发 出 去 。 例 如 图 
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6.1 中 ， 对 于 发 送 到 202.119.12.24 的 数据 包 ，Ra 必须 将 其 从 右面 的 端口 发 送 该 Rb， 而 不 能 
从 下 面 的 端口 发 出 。 通 常 ， 路 由 器 是 通过 查找 一 张 路 由 表 来 确定 转发 端口 的 。 在 路 由 表 中 ， 
每 一 项 都 说 明了 通 往 一 个 目标 地 址 应 该 通过 哪个 端口 进行 转发 ， 是 直接 转发 给 目的 地 还 是 需 
要 通过 下 一 个 路 由 器 再 进行 转发 。 因 此 ， 一 个 基本 的 路 由 表 的 表 项 包含 以 下 几 个 字段 : 目的 
地 址 ， 下 一 站 的 地 址 ， 转 发 端口 。 例 如 在 图 6.1 的 例子 中 ，Ra 的 路 由 表 中 至 少 需 要 有 表 6.1 
所 示 的 几 项 。 


To: 202.119.12.24 


M 


To: 202.119.15.137 . Ra Rb 网 络 2: 202.119.12.024 
— 


网 络 1: 202.119.15.024 


图 6.1 路 由 器 作用 示意 图 


表 6.1 路 由 器 Ra 的 部 分 路 由 表 


目的 地 址 转发 下 一 站 端口 
202.119.15.0/24 直接 转发 下 
202.119.12.0/24 | Rp | E 


从 表 6.1 可 以 看 出 ， 路 由 表 中 的 目的 地 址 是 网 络 地 址 ， 而 不 是 某 个 特定 的 主机 地 址 。 因 
为 这 样 可 以 极 大 的 减 小 路 由 表 的 大 小 ， 提 高 查找 的 效率 。 现 在 来 看 看 Rb 对 图 6.1 所 示 的 两 
个 数据 包 的 不 同 的 处 理 过 程 。 

首先 , 我 们 看 看 发 往 202.119.25.137 的 数据 包 。Ra 在 收 到 该 数据 包 后 通过 查找 路 由 表 发 
现 这 个 地 址 是 网 络 202.119.15.0/24 中 的 一 个 地 址 ， 需 要 通过 下 方 的 端口 进行 转发 。 注 意 ， 在 
转发 下 一 站 字段 中 202.119.15.0/24 表 项 注 明 的 是 直接 转发 。 这 个 字段 很 重要 ， 因 为 卫 数据 
包 是 通过 底层 的 物理 数据 帧 进行 传输 的 ， 所 以 路 由 器 在 将 数据 包 转 发 出 去 之 前 必须 确定 接收 
该 数据 包 的 下 一 站 的 物理 地 址 。 因 为 现在 要 转发 的 数据 包 是 直接 转发 ， 所 以 路 由 器 必须 将 它 
的 物理 地 址 设置 为 主机 202.119.25.137 的 物理 地 址 ， 这 样 数据 包 发 送 到 网 络 202.119.15.0/24 
中 之 后 ， 只 有 202.119.25.137 会 接收 到 该 数据 包 。 

对 于 发 往 202.119.12.24 的 数据 包 ，Ra 通过 查找 路 由 表 发 现 应 该 通过 右 端 口 将 其 转发 给 
路 由 器 Rb。 这 时 Ra 就 将 数据 包 的 物理 设置 为 Ra 的 左 端口 的 物理 地 址 并 将 其 从 右 端口 发 送 
到 该 端口 所 连接 的 网 络 上 。 在 该 网 络 上 ， 只 有 Rb 会 接收 该 数据 包 。Rb 收 到 数据 包 之 后 会 进 
行 同 样 的 处 理 。 
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上 面 看 到 了 路 由 器 的 内 部 通过 使 用 路 由 表 进 行 数据 转发 的 机 制 , 现在 有 另外 一 个 问题 出 
现 了 ， 即 路 由 器 的 路 由 表 是 怎样 建立 的 ? 这 需要 两 种 手段 。 

第 一 种 手段 是 路 由 器 根据 路 由 器 各 端口 直接 连接 的 网 络 自动 产生 一 些 路 由 表 项 。 例如 图 
6.1 的 例子 中 ， 路 由 器 Ra 的 下 面 的 端口 直接 连接 到 网 络 202.119.15.0/24， 那 么 它 就 可 以 产生 
表 6.1 中 的 第 一 条 表 项 了 。 同 样 ， 路 由 器 Rb 的 右 端口 是 直接 连接 到 网 络 202.119.12.0/24 的 ， 
这 样 Rb 也 可 以 产生 一 条 路 由 表 项 ， 如 表 6.2 所 示 。 


表 6.2 ”路 由 器 Rb 自动 产生 的 路 由 表 项 


目的 地 址 x n 
202.119.12.0/24 直接 转发 右 


第 二 种 手段 就 需要 路 由 协议 的 帮助 了 。 从 表 6.1 可 以 看 到 ，Ra 必须 知道 通 往 网 络 
202.119.12.0/24 必须 经 过 路 由 器 Rb. AA Ra 如 何 知道 这 一 点 呢 ， 方 法 只 有 一 个 ， 就 是 Rb 
告诉 Ra 这 一 点 。Rb 就 是 通过 路 由 协议 将 这 条 信息 告诉 Ra 的 。 

通过 这 两 种 手段 ， 路 由 器 就 可 以 建立 一 张 完整 的 路 由 表 了 。 


6.1.2 ”路 由 协议 的 作用 及 分 类 


路 由 协议 的 作用 在 于 它 是 路 由 器 能 够 与 其 他 的 路 由 器 交换 有 关 网 络 拓扑 和 可 达 性 的 信 
息 。 任 何 路 由 协议 的 首要 目标 是 保证 网 络 中 的 所 有 路 由 器 都 具有 一 个 完整 准确 的 网 络 拓扑 
图 。 这 一 点 非常 重要 ， 因 为 每 个 路 由 器 都 要 根据 这 个 网 络 拓扑 图 来 计算 自己 的 路 由 表 。 正 确 
的 路 由 表 能 够 提高 TP 数据 包 正 确 到 达 目 的 地 的 几率 , 而 不 正确 或 不 完整 的 路 由 表 则 使 得 路 由 
器 无 法 将 数据 包 转 发 到 目的 地 ， 更 严重 的 情况 是 它 可 能 在 网 络 上 循环 一 段 较 长 的 时 间 ， 白 白 
的 消耗 了 网 络 带 宽 和 路 由 器 的 资源 。 

路 由 协议 可 以 分 为 域内 和 域 间 两 类 。 一 个 域 通常 又 可 以 称 之 为 自治 系统 AS 

(Autonommous System) 。AS 是 一 个 由 单一 实体 控制 和 管理 的 路 由 器 集合 ， 采 用 一 个 惟一 

的 AS 号 来 标识 。 域 内 协议 (又 称 为 内 部 网 关 协 议 IGP) 用 于 在 同一 个 As 中 的 路 由 器 之 间 ， 
其 作用 是 计算 AS 中 的 任意 两 个 网 络 之 间 的 最 快 或 者 费用 最 低 的 通路 ， 以 达到 最 佳 的 网 络 性 
能 。 域 间 协 议 又 称 为 外 部 网 关 协 议 EGP， 它 用 于 在 不 同 的 自治 系统 间 的 路 由 器 之 间 ， 其 作用 
是 计算 那些 需要 穿越 不 同 自治 系统 的 通路 。 由 于 这 些 自治 系统 是 由 不 同 的 组 织 来 管理 的 ， 
此 在 选择 穿越 自治 系统 的 通路 时 ， 我 们 所 依据 的 标准 就 不 只 是 性 能 了 ， 而 是 要 依据 多 种 策略 
和 标准 ， 如 费用 、 可 用 性 、 性 能 、AS 间 的 商业 关系 等 。 

另外 根据 路 由 协议 采用 的 路 由 算法 不 同 可 以 将 其 分 为 基于 距离 向 量 算法 的 路 由 协议 和 
基于 链 路 状态 算法 的 路 由 协议 。 下 面 来 看 看 这 两 种 路 由 算法 的 原理 。 
6121 距离 向 量 路 由 算法 


距离 向 量 路 由 算法 的 基本 思想 是 : 所 有 路 由 器 都 会 把 它 所 知道 的 (不 管 是 自己 产生 的 还 
是 从 其 他 地 方 获得 的 ) 网 络 和 到 达 该 网 络 的 距离 等 方面 的 信息 告诉 与 其 相 邻 的 路 由 器 。 人 允许 
距离 向 量 路 由 协议 的 路 由 器 会 向 与 之 直接 相 邻 的 路 由 器 发 送 多 个 距离 向 量 ， 一 个 距离 向 量 由 
一 个 二 元 组 { 网 络 地 址 ， 距 离 } 表 示 。 在 这 个 二 元 组 中 ， 距 离 表 示 的 是 发 送 该 向 量 的 路 由 器 与 
目的 网 络 之 间 通 路 上 的 路 由 器 的 数量 , 即 跳 数 。 通 过 相 邻 路 由 器 之 间 的 这 种 距离 向 量 的 交换 ， 
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每 个 路 由 器 最 后 都 会 知道 通过 各 个 端口 所 能 到 达 的 网 络 及 到 达 该 网 络 所 需 的 代价 。 

路 由 器 根据 收 到 距离 向 量 获得 到 达 各 个 网 络 的 代价 的 具体 过 程 如 下 所 述 。 路 由 器 在 收 到 
相 邻 路 由 器 发 送 的 距离 向 量 时 ， 会 把 自身 的 距离 值 〈 通 常 为 D) 加 到 它 所 收 到 的 距离 向 量 的 
距离 值 上 。 然 后 该 路 由 器 把 这 个 新 计算 出 来 的 到 达 目 的 网 络 的 距离 值 与 其 自身 的 记录 进行 比 
较 〈 如 果 没 有 该 目的 网 络 地 址 相 匹配 的 记录 就 直接 将 距离 向 量 添加 到 本 地 距离 向 量 库 中 ) ， 
如 果 新 的 距离 值 比 已 有 的 小 ， 那 么 路 由 器 就 用 新 的 距离 值 来 更 新 距离 向 量 库 ， 并 据 此 生成 一 
个 新 的 路 由 表 ， 在 路 由 表 中 把 发 送 该 距离 向 量 的 路 由 器 作为 达到 该 目的 网 络 的 转发 下 一 站 。 
然后 路 由 器 再 将 自己 更 新 后 的 距离 向 量 发 送 到 相 邻 的 路 由 器 。 

距离 向 量 路 由 算法 很 简单 ， 实 现 也 很 容易 。 但 它 有 一 个 很 严重 的 问题 。 我 们 看 看 图 6.2 
所 示 的 例子 。 


{202.119.12.0, 2} {202.119.12.0, 1} 
4 一 一 «— — 


Ra Rb Rc 网 络 2: 202.119.12.0/24 


——> ——> 
{202.119.12.0, 3} {202.119.12.0, 2} 


To: 202.119.1224 
<< 


Ra Rb Re 网 络 2，202.119.12 024 


—> 
To: 202.119.12.24 


To: 202.119.1224 


图 6.2 距离 向 量 路 由 算法 举例 


在 图 6.2 中 ,有 3 个 路 由 器 ， 其 中 路 由 器 Re 连接 到 网 络 202.119.12.0/24。 图 中 上 面 的 部 分 
说 明 的 是 路 由 器 之 间 交 换 距 离 向 量 信息 的 过 程 。 下 面部 分 说 明 的 是 在 路 由 器 Rb 和 Re 之 间 的 通 
路 断 开 之 后 数据 包 转 发 的 情况 ， 我 们 来 解释 一 下 ， 因 为 距离 向 量 路 由 算法 是 以 距离 最 小 的 向 量 
为 基础 来 计算 路 由 表 的 ， 所 以 在 图 的 上 半 部 分 ，Rb 会 将 到 达 网 络 202.119.12.0/24 的 下 一 站 设 
为 路 由 器 Rc. 在 下 半 部 分 ，Rb 则 会 将 到 达 网 络 202.119.12.0/24 的 下 一 站 设 为 路 由 器 Ra， 因 为 
Ra 向 它 发 送 了 向 量 {202.119.12.0, 3}. 而 Ra 则 会 把 达到 网 络 202.119.12.0/24 的 下 一 站 设 为 Rb。 
因此 当 有 一 个 数据 包 要 发 送 到 202.119.12.24 时 ， 该 数据 包 就 会 在 Ra 和 Rb 之 间 循 环 。 当 然 ， 
现在 很 多 路 由 器 都 可 以 防止 从 一 个 端口 进入 的 数据 包 再 从 该 端口 发 送出 去 ， 这 样 就 能 防止 图 
6.2 所 发 生 的 循环 了 。 但 应 该 清楚 ， 这 是 发 生 循环 的 最 简单 的 一 个 例子 。 如 果 三 个 或 三 个 以 上 
的 路 由 器 之 间 形 成 这 种 转发 的 循环 则 使 用 这 种 简单 的 措施 是 无 能 为 力 的 。 

解决 这 个 问题 的 办 法 很 简单 ， 就 是 禁止 把 到 达 目 的 网 络 的 距离 向 量 发 送 给 路 由 表 中 通 往 
该 网 络 的 下 一 站 。 那 么 在 图 6.2 的 上 半 部 分 中 ，Ra 就 不 能 发 送 距离 向 量 给 Rb, Rb 也 不 能 发 
送 距 离 向 量 给 Re 了 。 这 样 就 不 会 出 现 循环 了 。 
6122 链 路 状态 路 由 算法 


链 路 状态 路 由 算法 的 基本 思想 是 : 一 个 路 由 器 能 够 把 有 关连 接 到 该 路 由 器 的 链 路 的 状 
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态 、 费 用 及 任何 连接 到 该 链 路 的 路 由 器 的 标识 等 信息 通知 给 网 络 中 的 所 有 其 他 路 由 器 。 运 行 
链 路 状态 路 由 协议 的 路 由 器 会 向 整个 网 络 发 送 链 路 状态 数据 包 LSP. 一 个 LSP 通常 包含 一 个 
源 路 由 器 标识 、 一 个 相 邻 路 由 器 标识 及 两 者 之 间 的 链 路 的 费用 。LSP 被 所 有 的 路 由 器 接收 ， 
用 于 建立 一 个 网 络 的 整体 链 路 状态 库 ， 并 据 此 得 出 网 络 的 整体 拓扑 图 ， 再 计算 出 路 由 器 的 路 
由 表 。 路 由 器 在 获得 整个 网 络 拓扑 图 后 计算 路 由 表 的 方法 是 : 路 由 器 采用 最 短路 径 或 最 低 费 
用 的 通路 建立 一 个 以 本 路 由 器 为 根 的 路 由 器 树 。 除 了 与 本 路 由 器 直接 相连 的 网 络 之 外 ， 所 有 
网 络 地 址 的 下 一 站 都 为 在 该 路 由 器 树 上 从 根 节点 到 该 网 络 的 路 径 上 的 除根 节 外 的 最 高 的 节 


点 路 由 器 。 与 距离 向 量 路 由 算法 相 比 ， 链 路 状态 路 由 算法 具有 以 下 优点 : 


(1) 更 快 的 收敛 速度 。 所 谓 收敛 就 是 指 在 网 络 拓扑 发 生变 化 时 ， 路 由 器 将 该 变化 通知 
给 网 络 中 所 有 路 由 器 的 过 程 。 该 过 程 越 快 ， 那 么 在 网 络 拓扑 发 生变 化 时 ， 可 能 发 生 的 转发 错 


误 就 更 少 。 


(2) 更 小 的 网 络 开销 。 链 路 状态 路 由 协议 传送 的 LSP 只 反映 网 络 拓扑 的 变化 ， 而 不 是 


传送 整个 路 由 数据 库 。 
(3) 扩展 性 更 好 。 
(4) 更 容易 升级 。 


6.2 RIP 路 由 信息 协议 


按照 对 路 由 协议 的 分 类 ，RIP 协议 属于 域内 基于 距离 向 量 算法 的 路 由 协议 。 本 节 将 具体 
介绍 RIP 协议 的 工作 原理 。 


6.2.1. RIP 协议 数据 包 的 格式 
RIP 协议 数据 是 使 用 UDP 协议 进行 传输 的 ， 图 63 说 明 RIP 协议 数据 的 封装 关系 。 


RIP 数 据 包 


UDP 包头 UDP 数 据 包 数 据 区 


| 


PEK 


PARK 


图 6.3 RIP 协议 数据 的 传输 封装 


RIP 协议 使 用 的 标准 UDP 端口 号 为 320。RIP 协议 数据 包 的 内 部 格式 如 图 6.4 所 示 。 

数据 包 的 第 一 个 字 节 是 命令 字段 ， 其 值 可 以 是 1 一 6， 分 别 为 1 GAR) . 2 OME) 、3 
和 4 (不 用 ) . 5 GEH 和 6 ( 轮 询 表 项 ) 。 版 本 字段 可 以 为 1 或 2， 这 里 的 包 格式 是 版 本 
1 的 格式 。 地 址 类 型 字段 对 于 IP 协议 而 言 为 2。 度量 字段 的 单位 为 跳 数 ， 直 接连 接 的 度量 为 
1， 这 和 前 面 距离 向 量 路 由 算法 中 的 一 样 。 一 个 RIP 协议 数据 包 最 多 可 以 携带 25 条 距离 向 量 


信息 。 
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tre (1 一 6) 协议 版 本 CD 0 
地 址 类 型 (2) 0 
IPHhhk 
0 
0 
度量 (1 一 16) 


最 多 还 可 以 有 24 个 20 字 节 〈 地 址 类 型 -度量 ) 


图 6.4 RIP 数据 包 格式 


6.22 RIP 协议 的 工作 过 程 


我 们 根据 RIP 协议 的 各 个 不 同时 间 阶 段 以 及 对 不 同 的 REP 数据 包 的 响应 来 看 看 RIP 协议 
的 工作 过 程 。 

初始 化 ，RIP 协议 启动 时 ， 它 先 判 断路 由 器 启动 了 哪些 接口 ， 并 在 每 个 接口 上 发 送 一 个 
请 求 数据 包 ， 要 求 其 他 路 由 器 发 送 完整 路 由 表 。 在 点 对 点 链 路 中 ， 该 请 求 是 发 送 给 其 他 终点 
的 。 如 果 网 络 支持 广播 的 话 ， 这 种 请 求 是 以 广播 形式 发 送 的 。 目 的 UDP 端口 号 是 520。 这 种 
请 求 数据 包 的 命令 字段 为 1， 但 地 址 系列 字段 设置 为 0， 而 度量 字段 设置 为 16。 这 是 一 种 要 
求 另 一 端 完整 路 由 表 的 特殊 请 求 数据 包 。 

接收 到 请 求 : 如 果 这 个 请 求 是 刚才 提 到 的 特殊 请 求 ， 那 么 路 由 器 就 将 完整 的 路 由 表 发 送 
给 请 求 者 。 否 则 ， 就 处 理 请 求 中 的 每 一 个 表 项 : 如 果 有 连接 到 指明 地 址 的 路 由 ， 则 将 度量 设 
置 成 自己 的 值 ， 否 则 将 度量 置 为 16〈 度 量 为 16 是 一 种 称 为 “无 穷 大 ”的 特殊 值 ， 它 意味 着 
没有 到 达 目 的 的 路 由 ) ， 然 后 发 回响 应 。 

接收 到 响应 : 使 响应 生效 ， 可 能 会 更 新 路 由 表 。 可 能 会 增加 新 表 项 ， 对 已 有 的 表 项 进行 
修改 ， 或 是 将 已 有 表 项 删除 。 

定期 路 由 更 新 : 每 过 30 秒 ， 所 有 或 部 分 路 由 器 会 将 其 完整 路 由 表 发 送 给 相 邻 路 由 器 。 
发 送 路 由 表 可 以 是 广播 形式 的 〈 如 在 以 太 网 上 ) ， 或 是 发 送 给 点 对 点 链 路 的 其 他 终点 的 。 

触发 更 新 : 每 当 一 条 路 由 的 度量 发 生变 化 时 , 就 对 它 进行 更 新 。 不 需要 发 送 完整 路 由 表 ， 
而 只 需要 发 送 那些 发 生变 化 的 表 项 。 每 条 路 由 都 有 与 之 相关 的 定时 器 。 如 果 运 行 RIP 的 系统 
发 现 一 条 路 由 在 3 分 钟 内 未 更 新 ， 就 将 该 路 由 的 度量 设置 成 无 穷 大 〈《16) ， 并 标注 为 删除 。 
这 意味 着 已 经 在 6 个 30 秒 更 新 时 间 里 没收 到 通告 该 路 由 的 路 由 器 的 更 新 了 。 再 过 60 秒 ， 将 
从 本 地 路 由 表 中 删除 该 路 由 ， 以 保证 该 路 由 的 失效 已 被 传播 开 。 


6.2.3 RIP 协议 的 缺陷 


RIP 协议 看 起 来 很 简单 ， 但 它 有 一 些 缺 陷 。 首 先 ，RIP 没有 子 网 地 址 的 概念 。 因 此 无 法 
使 用 子 网 划分 技术 来 节省 IP 地 址 资源 。 有 一 些 实现 中 通过 接收 到 的 RIP 信息 ， 来 使 用 接口 
的 网 络 掩 码 ， 而 这 有 可 能 出 错 。 其 次 ， 在 路 由 器 或 链 路 发 生 故 障 后 ， 需 要 很 长 的 一 段 时 间 才 
能 稳定 下 来 。 这 段 时 间 通 常 需要 几 分 钟 。 在 这 段 建立 时 间 里 ， 可 能 会 发 生路 由 环 路 。 在 实现 
RIP 时 ， 必 须 采 用 很 多 微妙 的 措施 来 防止 路 由 环 路 的 出 现 ， 并 使 其 尽快 建立 。 采 用 跳 数 作为 
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路 由 度量 忽略 了 其 他 一 些 应 该 考虑 的 因素 。 同 时 ， 度 量 最 大 值 为 15 则 限制 了 可 以 使 用 RIP 
的 网 络 的 大 小 。 


6.2.4 RIP2 


RIP2 是 RIP 协议 的 第 二 个 版 本 ， 它 对 RIP 协议 做 了 扩充 但 可 以 和 RIP 版 本 1 兼容 。 
6.5 是 RIP2 的 数据 包 格 式 。 


0 4 10 16 24 31 


命令 (1~6) 协议 版 本 (1) 路 由 域 
地 址 类 型 (2) 路 由 标志 
卫 地 址 
子 网 掩 码 
下 一 站 地 址 
度量 (1 一 16) 
最 多 还 可 以 有 24 个 20 字 节 (地 址 类 型 -度量 ) 


图 6.5 RIP2 的 数据 包 格式 


RIP2 并 没有 改变 RIP 的 数据 包 格式 ， 只 是 将 原来 设 为 0 的 字段 赋予 了 一 定 的 意义 。 

路 由 域 是 RIP2 协议 实例 的 标识 ， 它 指出 了 这 个 数据 包 的 所 有 者 ， 即 发 送 者 。 它 允许 在 
一 个 路 由 器 中 允许 多 个 RIP2 协议 的 实例 。 路 由 标记 是 为 了 支持 外 部 网 关 协 议 而 存在 的 。 它 
携带 着 一 个 EGP BK BGP 的 自治 系统 AS S. 

每 个 表 项 的 子 网 掩 码 应 用 于 相应 的 IP 地 址 上 。 下 一 站 IP 地 址 指明 发 往 目的 IP 地 址 的 数 
据 包 该 发 往 哪里 。 该 字段 为 0 意味 着 发 往 目 的 地 址 的 数据 包 应 该 发 给 发 送 RIP 数据 包 的 系统 。 

RIP2 提供 了 一 种 简单 的 鉴别 机 制 。 可 以 指定 RIP 数据 包 的 前 20 字 节 表 项 地 址 系列 为 
0xffff， 路 由 标记 为 2。 表 项 中 的 其 余 16 字 节 包含 一 个 明文 口令 。 最 后 ，RIP2 除了 广播 外 ， 
还 支持 多 播 ， 这 可 以 减少 不 收听 RIP2 数据 包 的 主机 的 负担 。 


6.3 OSPF 开放 最 短路 径 优 先 


OSPF 是 除 RIP 外 的 另 一 个 内 部 网 关 协 议 。 和 RIP 不 同 的 是 它 使 用 的 是 链 路 状态 路 由 算 
法 。 它 克服 了 RIP 的 所 有 限制 。OSPF 5 RIP (以 及 其 他 路 由 协议 ) 的 另 一 个 不 同 点 在 于 ， 
OSPF 直接 使 用 全 协议， 而 不 是 UDP， 如 图 6.6 所 示 。 


OSPF 数 据 包 


Pik JP 数据 区 
6.6 OSPF 数据 包 的 封装 
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WF IP 头 部 的 协议 类 型 字段 ，OSPF 有 其 自己 的 值 。 
在 OSPF 中 ， 使 用 了 一 个 称 之 为 区 域 (Area) 的 概念 。 区 域 用 来 定义 一 个 自治 系统 中 的 
“4s ) 路 由 器 和 网 络 的 集合 。 在 OSPF 网 络 中 ， 必 须 有 一 个 区 域 0 用 来 标识 网 络 骨 干 区 域 。 如 果 配 
置 了 多 个 区 域 , 那么 所 有 的 非 0 区 域 都 必须 通过 一 个 区 域 边界 路 由 器 (ABR) 连接 到 区 域 0。 
在 一 个 区 域 中 ， 路 由 器 相互 发 布 和 交换 链 路 状态 通告 LSA， 并 为 该 区 域 建立 一 个 统一 的 映射 
图 ， 称 为 链 路 状态 数据 库 。 区 域 之 间 通 过 ABR 相互 传递 有 关 某 一 特定 网 络 和 拓扑 的 概括 信 
息 。 因 而 路 由 器 可 以 保存 有 关 其 所 有 区 域 中 的 所 有 网 络 及 路 由 器 的 完整 信息 ， 以 及 有 关 在 区 
域外 网 络 及 路 由 器 的 特殊 信息 。 路 由 器 中 有 足够 的 信息 来 引导 分 组 通过 合适 的 区 域 边界 路 由 
器 到 达 另 一 个 区 域 中 的 网 络 。 
作为 一 种 链 路 状态 协议 而 不 是 距离 向 量 协议 ，OSPF 还 有 着 一 些 优 于 RIP 的 特点 。 

(1) OSPF 可 以 对 每 个 IP 服务 类 型 计算 各 自 的 路 由 集 。 这 意味 着 对 于 任何 目的 ， 可 以 
有 多 个 路 由 表 表 项 ， 每 个 表 项 对 应 着 一 个 IP 服务 类 型 。 

QD 给 每 个 接口 指派 一 个 无 维 数 的 费用 。 可 以 通过 吞吐 率 、 往 返 时 间 、 可 靠 性 或 其 他 
性 能 来 进行 指派 。 可 以 给 每 个 IP 服务 类 型 指派 一 个 单独 的 费用 。 

(3) 当 对 同一 个 目的 地 址 存在 着 多 个 相同 费用 的 路 由 时 ，OSPF 在 这 些 路 由 上 平均 分 
配 流量 ， 称 之 为 流量 平衡 。 

(4) OSPF 支持 子 网 ， 子 网 掩 码 与 每 个 通告 路 由 相连 。 这 样 就 允许 将 一 个 任何 类 型 的 他 
地 址 分 割 成 多 个 不 同 大 小 的 子 网 。 到 一 个 主机 的 路 由 是 通过 全 1 子 网 掩 码 进行 通告 的 。 默 认 
路 由 是 以 瑟 地 址 为 0.0.0.0、 网 络 掩 码 为 全 0 进行 通告 的 。 

(5) 路 由 器 之 间 的 点 对 点 链 路 不 需要 每 端 都 有 一 个 卫 地 址 ， 称 之 为 无 编号 网 络 。 这 样 
可 以 节省 IP 地 址 一 一 现在 非常 紧缺 的 一 种 资源 。 

(6) 采用 了 一 种 简单 鉴别 机 制 。 可 以 采用 类 似 于 RIP2 机 制 的 方法 指定 一 个 明文 口令 。 

(7) OSPF 采用 多 播 ， 而 不 是 广播 形式 ， 以 减少 不 参与 OSPF 的 系统 负担 。 

随 着 大 部 分 厂商 支持 OSPF， 在 很 多 网 络 中 OSPF 将 逐步 取代 RIP。 


6.4 BGP 边界 网 关 协 议 


BGP 是 一 种 不 同 自治 系统 的 路 由 器 之 间 进 行 通 信 的 外 部 网 关 协 议 。BGP 是 ARPANET 
所 使 用 的 老 EGP 的 取代 品 。BGP 的 主要 目标 是 为 处 于 不 同 AS 中 的 路 由 器 之 间 进 行路 由 信息 
通信 提供 保证 。BGP 在 发 送 一 个 目的 网 络 的 可 达 性 的 同时 会 包含 IP 数据 包 到 达 目 的 网 络 过 
程 中 必须 经 过 的 AS 的 列表 ， 这 个 列表 称 为 通路 向 量 。 通 路 向 量 信息 是 很 有 用 的 ， 因 为 只 要 
简单 的 查找 以 下 BGP 路 由 更 新 中 的 AS 编号 即 能 有 效 的 避免 环 路 的 出 现 。 

BGP 系统 与 其 他 BGP 系统 之 间 交 换 网 络 可 到 达 信 息 。 这 些 信息 包括 数据 到 达 这 些 网 络 
所 必须 经 过 的 自治 系统 AS 中 的 所 有 路 径 。 这 些 信息 足以 构造 一 幅 自治 系统 连接 图 。 然 后 ， 
可 以 根据 连接 图 删除 环 路 , 制订 路 由 策略 。 首先, 将 一 个 自治 系统 中 的 IP 数据 包 分 成 本 地 流 
量 和 通过 流量 。 在 自治 系统 中 ， 本 地 流量 是 起 始 或 终止 于 该 自治 系统 的 流量 。 也 就 是 说 ， 其 
信 源 IP 地 址 或 目的 IP 地 址 所 指定 的 主机 位 于 该 自治 系统 中 。 其 他 的 流量 则 称 为 通过 流量 。 
在 Internet 中 使 用 BGP 的 一 个 目的 就 是 减少 通过 流量 。 
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可 以 将 自治 系统 分 为 以 下 几 种 类 型 : 

CD BABAR (stub AS) ， 它 与 其 他 自治 系统 只 有 单个 连接 。stub AS 只 有 本 地 流量 。 

OD 多 宿主 自治 系统 (multihomed AS) ， 它 与 其 他 自治 系统 有 多 个 连接 ， 但 拒绝 传送 
通过 流量 。 

G) 转送 自治 系统 (transit AS) ， 它 与 其 他 自治 系统 有 多 个 连接 ， 在 一 些 策略 准则 之 
下 ， 它 可 以 传送 本 地 流量 和 通过 流量 。 

这 样 ， 可 以 将 Internet 的 总 拓扑 结构 看 成 是 由 一 些 残 桩 自治 系统 、 多 接口 自治 系统 以 及 
转送 自治 系统 的 任意 互 连 。 残 桩 自治 系统 和 多 接口 自治 系统 不 需要 使 用 BGP 一 一 它们 通过 运 
行 EGP 在 自治 系统 之 间 交 换 可 到 达 信息 。BGP 人 允许 使 用 基于 策略 的 路 由 。 由 自治 系统 管理 
员 制 订 策略 ， 并 通过 配置 文件 将 策略 指定 给 BGP。 制 订 策 略 并 不 是 协议 的 一 部 分 ， 但 指定 策 
略 允 许 BGP 实现 在 存在 多 个 可 路 由 径 时 选择 路 径 ， 并 控制 信息 的 重 发 送 。 路 由 策略 与 政治 、 
安全 或 经 济 因素 有 关 。 

BGP 5 RIP 和 OSPF 的 不 同 之 处 在 于 BGP 使 用 TCP 作为 其 传输 层 协议 。 两 个 运行 BGP 
的 系统 之 间 建 立 一 条 TCP 连接 ， 然 后 交换 整个 BGP 路 由 表 。 从 这 个 时 候 开 始 ， 在 路 由 表 发 
生变 化 时 ， 再 发 送 更 新 信号 。BGP 是 一 个 距离 向 量 协议 ， 但 是 与 RIP 不 同 的 是 ，BGP 列举 
了 到 每 个 目的 地 址 的 路 由 《自治 系统 到 达 目 的 地 址 的 序列 号 ) 。 这 样 就 排除 了 一 些 距离 向 量 
协议 的 问题 。 采 用 16 位 数字 表示 自治 系统 标识 。BGP 通过 定期 发 送 keepalive 数据 包 给 其 邻 
站 来 检测 TCP 连接 对 端的 链 路 或 主机 失败 。 两 个 数据 包 之 间 的 时 间 间 隔 建议 值 为 30 秒 。 


6.5 Internet 的 路 由 体系 结构 


上 面 介绍 了 各 种 路 由 协议 的 机 制 ， 本 节 要 说 明 这 些 不 同 的 路 由 协议 是 怎样 存在 于 整个 
Internet 中 的 。 图 6.7 就 说 明了 这 种 共存 关系 。 


ASIJ AS2 


a 
BGP. 
OSPF — RIP RIP 
OSPF 


图 6.7 Internet 中 可 以 同时 允许 多 种 路 由 协议 


从 图 中 可 以 看 出 ， 在 AS 内 部 允许 的 域内 路 由 协议 ， 而 在 AS 的 边界 路 由 器 之 间 人 允许 运 
行 的 是 域 间 路 由 协议 。 当 然 , 这 只 是 一 个 示意 图 , 实际 上 路 由 协议 的 关系 远 比 图 中 所 示 复 杂 ， 
它 甚 至 允许 在 同一 个 AS 内 部 允许 多 种 路 由 协议 。 
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到 目前 为 止 ， 我 们 讲 的 技术 都 是 点 到 点 的 数据 传输 技术 ( 单 播 ) 。 即 使 有 的 技术 中 要 使 
用 到 一 点 到 多 点 的 传输 技术 (如 ARP. OSPF 等 ) ， 也 没有 深入 研究 这 种 一 点 到 多 点 的 传输 
技术 是 怎样 工作 和 实现 的 。 本 章 开始 讨论 这 个 问题 。 因 为 一 点 到 多 点 的 数据 传输 可 以 分 为 广 
播 和 多 播 两 种 ， 而 广播 技术 比 多 播 简单 得 多 ， 所 以 先 用 一 节 说 明 广 播 的 工作 机 制 ， 后 面 几 节 
用 来 解释 多 播 技术 。 


71 广播 


所 谓 广播 就 是 发 送 一 个 数据 给 一 个 范围 内 (通常 是 一 个 网 络 ) 的 所 有 系统 ， 该 范围 内 的 
所 有 系统 都 应 该 接收 该 数据 。 使 用 他 协议 可 以 实现 数据 广播 。 和 单 播 的 数据 包 一 样 ， 广播 的 
数据 包 也 是 封装 在 物理 网 络 的 数据 帧 中 进行 传输 的 。 

我 们 前 面 讲 到 过 ， 数 据 包 或 数据 帧 中 必须 要 有 数据 的 目标 系统 的 地 址 。 由 于 广播 数据 包 
实际 是 有 多 个 接收 者 的 ， 有 几 个 原因 使 得 发 送 无 法 将 每 个 接收 者 的 地 址 都 放 入 数据 包 或 数据 
帧 中 。 第 一 ， 数 据 包 和 数据 帧 中 只 有 一 个 目的 地 址 字段 ， 无 法 容纳 多 个 目的 地 址 ; 第 二 ， 发 
送 者 往往 也 不 知道 数据 的 确切 接收 者 都 是 谁 。 例 如 要 向 网 络 内 的 所 有 主机 发 送 数据 并 不 需要 
知道 网 络 中 都 有 哪些 主机 ， 它 们 的 地 址 是 什么 。 

因此 ， 必 须 有 一 种 特殊 的 地 址 ， 它 能 代表 网 络 中 的 所 有 主机 。 这 种 地 址 就 称 之 为 广播 地 
址 。 不 同 的 协议 层 和 同一 层次 中 的 不 同 技术 使 用 的 技术 都 是 不 同 的 。 


7.1.1 物理 层 的 广播 


由 于 IP 数据 包 都 是 封装 在 物理 网 络 层 的 数据 帧 中 进行 传输 的 ， 接 收 方 的 IP 也 只 有 在 底 
层 的 物理 网 络 接收 了 数据 帧 之 后 才能 从 物理 网 络 层 协议 取得 该 数据 包 。 所 以 TP. 层 要 将 数据 进 
行 广播 ， 必 须 通知 物理 网 络 将 数据 包 进 行 广播 。 所 以 物理 层 也 需要 有 广播 地 址 的 表示 方法 ， 
要 有 广播 数据 的 发 送 和 接收 技术 。 

大 多 数 物理 网 络 技术 都 有 表示 广播 地 址 的 方法 。 例 如 在 以 太 网 中 , 每 个 以 太 网 地 址 长 48 
位 ， 所 有 位 都 为 1 的 地 址 就 表示 广播 地 址 。 以 太 网 的 网 卡 可 以 接收 两 种 数据 帧 ， 一 种 就 是 目 
的 地 址 是 本 网 卡 物理 地 址 的 数据 帧 ， 另 一 种 就 是 目的 地 址 是 广播 地 址 的 数据 帧 。 

物理 网 络 中 广播 数据 帧 的 发 送 技术 也 各 不 相同 。 例 如 在 以 太 网 这 样 的 总 线 型 广播 式 网 络 
中 ， 广 播 可 以 通过 发 送 一 个 数据 帧 实现 ， 因 为 所 有 网 络 中 的 网 卡 都 会 收 到 该 数据 帧 。 而 在 一 
些 点 到 点 连接 的 非 广播 型 网 络 中 ， 要 发 送 一 个 广播 数据 帧 必须 向 网 络 中 每 个 系统 单独 发 送 一 
个 数据 帧 。 
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7.1.2 IP 协议 的 广播 


在 第 3 章 中 详细 介绍 了 各 种 卫 地 址 ， 在 IP 地 址 的 五 种 类 型 中 并 没有 广播 地 址 类 型 。 卫 
地 址 由 两 部 分 组 成 ， 即 网 络 标识 和 主机 标识 。 卫 协议 的 广播 地 址 就 是 将 网 络 标识 或 主机 标识 
设置 为 特定 的 值 来 表示 的 。 

首先 ， 有 一 个 特别 的 IP 地 址 : 255.255.255.255。 这 个 地 址 用 来 表示 本 网 络 内 广播 。 路 由 
器 接收 到 目的 地 址 为 该 地 址 的 数据 包 是 不 会 将 其 进行 转发 的 。 因 此 使 用 该 地 址 的 广播 数据 包 
是 不 会 扩散 到 本 地 网 络 之 外 的 。 这 个 地 址 对 于 IP 地 址 自动 分 配 技术 很 有 用 ,因为 系统 在 启动 
根本 无 法 知道 本 地 网 络 的 标识 。 它 就 是 用 该 地 址 发 送 一 个 广播 数据 包 并 等 待 地 址 分 配 服务 器 
的 响应 。 

另外 ， 主 机 标识 各 位 都 为 1 的 地 址 表示 指定 网 络 的 广播 ， 这 个 地 址 中 的 网 络 标识 部 分 指 
定 了 该 广播 数据 包 应 该 在 其 中 进行 广播 的 网 络 ， 该 网 络 可 以 不 是 本 地 网 络 。 


7.1.3 IP 广播 的 过 程 和 问题 


当 卫 要 发 送 一 个 广播 数据 包 时 , 首先 它 要 确定 这 个 广播 是 本 地 网 络 内 的 广播 还 是 其 他 网 
络 的 广播 。 第 一 种 情况 ， 如 果 是 本 网 络 内 的 广播 ， 它 应 该 将 目的 IP 地 址 设 为 第 一 种 正 广播 
地 址 或 网 络 标识 为 本 地 网 络 标识 的 第 二 种 IP. 广播 地 址 , 然后 要 求 底层 物理 网 络 将 该 数据 包 广 
播 出 去 。 第 二 种 情况 ， 如 果 是 外 部 网 络 的 广播 ， 它 就 应 该 将 目的 IP 地 址 设 为 第 二 种 IP 广播 
地 址 ， 但 不 能 要 求 物理 网 络 广播 该 数据 包 。 而 是 将 数据 包 以 单 播 形式 发 送 给 路 由 器 。 路 由 器 
在 处 理 这 种 广播 数据 包 时 ， 先 与 单 播 数据 包 一 样 查找 路 由 表 确定 下 一 站 。 如 果 下 一 站 是 另 一 
个 路 由 器 ， 那 它 的 处 理 方式 就 和 单 播 数据 包 一 样 ， 将 它 转发 给 下 一 站 路 由 器 。 如 果 发 现下 一 
站 是 直接 连接 ， 即 目的 网 络 是 直接 连接 在 该 路 由 器 上 的 ， 这 时 路 由 器 就 要 求 相应 端口 的 物理 
网 络 层 以 广播 的 形式 将 数据 发 送 到 相应 的 网 络 上 ， 同 时 路 由 器 还 需要 将 该 数据 包 提交 给 路 由 
器 的 相应 上 层 协议 处 理 ， 因 为 路 由 器 也 是 该 网 络 中 的 一 个 系统 。 

对 于 广播 包 的 接收 和 单 播 包 的 接收 过 程 相同 。 

需要 强调 的 是 : 广播 地 址 只 能 用 作 目 的 地 址 ， 数 据 包 或 数据 帧 中 的 源 地 址 决 不 多 许 使 用 
广播 地 址 。 

广播 技术 虽然 很 简单 ， 有 时 也 很 有 用 , 但 它 消耗 的 资源 太 多 , 所 以 应 尽量 限制 它 的 使 用 。 
因为 广播 网 络 中 的 每 个 系统 的 各 层 协议 〈 从 物理 层 知道 该 数据 的 最 终 目 标 层 ) 都 需要 处 理 该 
数据 包 ， 而 其 中 大 多 数 系统 最 终 还 是 将 其 丢弃 。 
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广播 中 ， 接 收 方 是 被 动 的 一 方 。 因 为 不 管 它 愿 不 愿意 ， 它 都 必须 接收 广播 数据 包 并 对 其 
进行 处 理 ， 尽 管 最 后 还 是 将 其 丢弃 。 多 播 也 是 一 种 将 一 个 数据 包 发 送 给 一 个 范围 内 的 所 有 系 
统 的 技术 ， 但 和 广播 技术 不 同 的 是 ， 接 收 方 系统 可 以 选择 是 否 加 入 到 这 个 范围 中 ， 即 它 可 以 
选择 是 否 接收 一 个 多 播 数据 包 。 这 样 既 实现 广播 的 方便 性 ， 又 不 至 于 浪费 系统 的 资源 。 
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但 实现 多 播 的 技术 比 广播 复杂 的 多 。 首 先 ， 在 多 播 中 ， 参 与 多 播 的 接收 者 的 数量 和 范围 
是 不 固定 的 ， 因 为 接收 者 可 以 选择 是 否 加 入 。 我 们 将 参与 多 播 的 所 有 接收 者 称 为 组 ， 所 以 多 
播 也 可 以 称 为 组 播 。 多 播 对 于 一 些 应 用 是 很 重要 的 ， 例 如 电视 会 议 、 聊 天 室 等 。 但 是 由 于 组 
中 成 员 是 不 固定 的 ， 甚 至 可 以 在 组 建立 之 后 加 入 或 退出 。 所 以 多 播 的 地 址 不 能 使 用 广播 的 那 
种 固定 的 表示 方法 。 另 外 ， 同 一 时 间 可 能 会 存在 多 个 组 ， 而 同一 个 系统 也 可 以 同时 加 入 多 个 
组 。 这 也 增加 多 播 地 址 的 复杂 性 。 下 面具 体 看 看 多 播 地 址 和 技术 的 具体 机 制 。 


7.2.1 物理 层 的 多 播 


所 有 的 数据 传输 和 接收 都 需要 物理 层 的 参与 ， 多 播 技术 也 一 样 ， 所 以 物理 层 也 需要 有 多 
播 的 表达 的 传输 技术 。 

首先 还 是 目的 地 址 的 表示 问题 。 多 数 物理 网 络 技术 都 保留 了 一 部 分 地 址 空间 用 来 表示 
多 播 地 址 。 和 广播 技术 只 需要 一 个 或 几 个 广播 地 址 不 同 ， 因 为 在 同一 个 网 络 可 能 同时 会 存在 
多 个 多 播 组 ， 为 了 区 分 不 同 的 组 ， 所 以 需要 有 较 多 的 多 播 地 址 。 当 一 组 系统 需要 进行 多 播 通 
信 时 ， 它 们 可 以 从 这 些 保留 的 地 址 空间 中 选取 一 个 地 址 所 谓 该 组 的 多 播 地 址 。 为 了 接收 该 目 
的 地 址 为 该 多 播 地 址 的 数据 帧 ， 每 个 系统 都 必须 对 它 的 网 络 接口 进行 配置 ， 让 它 识 别 该 地 址 
并 接收 目的 地 址 为 该 地 址 的 数据 。 

各 种 物理 网 络 由 于 地 址 的 表示 不 同 ， 所 以 多 播 地 址 的 表示 也 不 同 。 我 们 以 以 太 网 为 例 说 
明 多 播 地 址 技术 。 在 以 太 网 地 址 中 ， 最 高 字 节 的 最 低位 为 1 的 地 址 都 是 多 播 地 址 。 例 如 : 
43:24:D4:54:37:01 就 是 一 个 多 播 地 址 ， 而 广播 地 址 (FF:FF:FF:FF:FF:FF) 是 多 播 地 址 的 一 个 
特例 。 

以 太 网 中 ， 网 卡 的 初始 设置 只 会 接收 物理 地 址 为 本 网 卡 地 址 和 广播 地 址 的 数据 帧 。 但 可 
用 通过 简单 设置 使 它 接 收 特定 多 播 地 址 的 数据 帧 。 


7.2.2 IP 协议 的 多 播 


全 协议 的 多 播 除了 具有 上 述 的 组 成 员 的 动态 加 入 和 退出 特点 外 , 还 有 一 个 优点 ， 即 它 的 
组 成 员 可 以 是 跨 网 络 的 ,没有 范围 的 限制 。 IP 协议 的 多 播 数据 包 可 以 通过 物理 网 络 的 多 播 技 
术 在 本 地 网 络 中 进行 传输 , 但 由 于 物理 网 络 的 多 播 技术 无 法 跨越 网 络 , 所 以 他 协议 需要 特定 
的 技术 来 将 IP 数据 包 进 行 传输 要 将 多 播 数据 包 进行 跨 网 络 的 传送 , 必须 有 一 种 特殊 的 路 由 
器 的 帮助 ， 称 为 多 播 路 由 器 。 我 们 后 面 讨论 具体 的 工作 过 程 。 
7.2.2.1 IP 多 播 地 址 


他 协议 的 五 种 地 址 类 型 中 ,D 类 地 址 是 专门 用 作 进 行 多 播 通 信 的 。D 类 地 址 的 地 址 范围 
是 224.0.0.0 一 239.255.255.255。 其 中 224.0.0.0 被 保留 不 能 赋 给 任何 多 播 组 ，224.0.0.1 是 一 个 
所 有 主机 组 地 址 ， 它 表示 参与 卫 多 播 的 所 有 主机 和 路 由 器 。 通常 ,所 有 主机 组 地 址 用 来 表示 
本 地 网 络 中 所 有 参与 卫 多 播 的 主机 。 IP 协议 中 没有 代表 整个 Internet 中 所 有 主机 的 多 播 地 
址 。 

需要 注意 的 是 ，IP 多 播 地 址 和 广播 地 址 一 样 ， 只 能 用 作 目 的 地 址 而 不 能 用 在 IP 数据 包 
头 的 源 地 址 字段 中 。 它 们 也 不 能 出 现在 源 路 由 和 记录 路 由 选项 中 。 另 外 ， 不 能 为 多 播 数据 包 
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产生 ICMP 错误 信息 。 
7222 IP 多 播 地 址 到 以 太 网 多 播 地 址 的 映射 


BLA P 多 播 数据 包 最 终 是 要 以 物理 层 网 络 的 多 播 数据 帧 进行 传输 的 ， 所 以 使 用 IP 多 播 
地 址 来 指定 一 个 多 播 组 地 址 后 , IP 协议 还 必须 告诉 物理 网 络 应 该 将 该 数据 包 发 送 到 哪个 物理 
层 的 多 播 组 中 。 

IP 协议 标准 中 指定 了 一 种 将 IP 多 播 地 址 映射 为 以 太 网 多 播 地 址 的 方法 。 这 个 方法 很 简 
单 : BOK IP 多 播 地 址 转换 为 一 个 相应 的 以 太 网 多 播 地址 ， 只 需 将 IP 多 播 地 址 的 低 23 位 填 入 
以 太 网 地 址 01:00:5E:00:00:00 的 低 23 位 即 可 。 例如 下 多 播 地 址 224.0.0.1 就 映射 到 以 太 网 多 
播 地 址 01:00:5E:00:00:01 . 

需要 指出 的 是 ， 这 种 映射 不 是 惟一 的 。 因 为 IP 地 址 的 D 类 地 址 中 ， 除 了 最 高 的 4 位 为 
D 类 地 址 的 标识 外 , 还 有 28 位 是 可 变 的 。 将 28 位 映射 为 23 位 就 意味 着 32 个 IP. 多 播 地址 共 
用 一 个 以 太 网 的 多 播 地 址 。 虽 然 这 种 映射 不 是 惟一 的 ,但 因为 P 多 播 地 址 的 范围 很 大 , 主机 
在 选择 多 播 IP 地 址 时 ， 选 中 两 个 低 23 位 相同 的 地 址 的 可 能 性 是 很 小 的 。 但 因为 可 能 会 存在 
重复 的 映射 ,所 以 IP 协议 对 收 到 的 多 播 数据 包 必 须 小 心 处 理 , 将 不 是 发 往 主机 的 数据 包 丢 弃 。 
72.2.3 耳 协 议 对 多 播 数据 包 的 处 理 


主机 要 发 送 一 个 多 播 数据 包 很 简单 。IP 协议 软件 应 该 允许 应 用 程序 将 一 个 多 播 地址 指定 
为 数据 的 目的 地 址 。 物 理 网 络 层 的 接口 也 应 该 能 将 一 个 IP 多 播 地 址 映射 为 一 个 物理 多 播 地 
址 。 这 样 多 播 数据 包 就 可 以 发 送出 去 了 。 

对 于 多 播 数 据 包 的 接收 ， 则 比 发 送 过 程 复杂 。 首 先 ，IP 协议 软件 需要 提供 一 个 接口 ， 允 
许 用 户 加 入 一 个 多 播 组 。 同一 个 主机 中 可 能 有 多 个 应 用 程序 加 入 了 同一 个 多 播 组 。 如 果 这 样 ， 
IP 协议 必须 给 每 一 个 应 用 程序 复制 一 份 该 数据 包 的 副本 。 如 果 所 有 的 应 用 程序 都 退出 了 一 个 
多 播 组 ， 那 么 IP 协议 就 不 应 该 再 接收 该 多 播 组 的 数据 包 。 

对 了 P 多 播 数据 包 的 路 由 就 更 复杂 了 ,这 需要 多 播 组 中 主机 系统 和 多 播 路 由 器 的 合作 才能 
完成 。 在 7.3 节 将 讨论 他 多 播 数据 包 的 路 由 问题 。 


7.3 IGMP 


要 加 入 本 地 网 络 中 的 多 播 通信 组 ， 主 机 只 需要 能 发 送 和 接收 多 播 数据 包 即 可 。 但 要 加 入 
一 个 跨 网 络 的 多 播 通信 组 ， 主 机 还 需要 将 字 节 加 入 的 信息 通知 给 本 地 的 多 播 路 由 器 。 本 地 路 
由 器 与 其 他 的 多 播 路 由 器 联系 ， 传 递 多 播 组 成 员 信息 并 建立 路 由 。 而 在 多 播 路 由 器 传递 多 播 
组 成 员 信息 给 其 他 多 播 路 由 器 之 前 ， 它 必须 确定 在 本 地 网 络 中 有 主机 系统 加 入 了 该 多 播 组 。 
主机 和 多 播 路 由 器 是 通过 Internet 组 管理 协议 IGMP (Internet Group Management Protocol) 
来 管理 多 播 组 测 成 员 关 系 的 。 


7.3.1 IGMP 数据 包 格 式 
IGMP 数据 包 的 长 度 是 固定 的 ， 为 8 个 字 节 ， 即 64 位 。 其 结构 如 图 7.1 所 示 。 
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16 31 
未 使 用 校 验 和 
下 多 播 地 址 


图 7.1 IGMP 数据 包 格式 


类 型 字段 的 值 可 以 为 1 8 2. 1 表示 是 由 多 播 路 由 器 发 出 的 查询 数据 包 ，2 表示 是 主机 发 
出 的 报告 数据 包 。 校 验 和 的 计算 和 ICMP 协议 相同 。 组 地 址 为 D 类 IP 地 址 。 在 查询 数据 包 
中 组 地 址 设置 为 0， 在 报告 数据 包 中 组 地 址 为 要 参加 的 组 地 址 。 

和 ICMP 一 样 ， 虽 然 IGMP 是 封装 在 IP 数据 包 中 进行 传输 的 ， 但 它 被 当 作 P 层 的 一 部 
4. IP 头 部 协议 类 型 字段 用 2 表示 IGMP 协议 。 


7.3.2 IGMP 协议 的 工作 机 制 


IGMP 协议 的 整个 工作 过 程 可 以 分 为 两 个 部 分 。 

第 一 部 分 , 当 一 个 主机 加 入 一 个 新 的 多 播 组 时 , 它 发 送 一 个 IGMP 报告 数据 包 到 网 络 上 。 
该 数据 包 的 P 多 播 地 址 字段 就 设置 为 它 加 入 的 多 播 地 址 , 且 该 数据 包 的 目的 地 址 设 为 所 有 主 
机 多 播 地 址 224.0.0.1。 因 为 使 用 这 个 目的 地 址 的 数据 包 会 被 本 地 网 络 中 所 有 参与 多 播 的 主机 
和 路 由 器 所 接收 , 所 以 主机 不 需要 知道 本 地 多 播 路 由 器 的 P 地 址 。 多 播 路 由 器 在 接收 到 该 数 
据 包 后 会 通过 向 其 他 多 播 路 由 器 传播 组 成 员 信息 来 建立 必要 的 路 由 信息 。 

第 二 部 分 ， 因 为 多 播 组 的 成 员 是 变化 的 ， 随 时 可 能 有 主机 加 入 一 个 组 ， 也 随时 有 主机 退 
出 一 个 组 。 所 以 ， 本 地 的 多 播 路 由 器 需要 定期 的 查询 每 个 组 中 在 本 地 网 络 还 有 那些 成 员 。 这 
是 通过 向 网 络 中 发 送 IGMP 查询 数据 包 完成 的 。 多 播 路 由 器 向 每 个 端口 连接 的 网 络 中 发 送 一 
个 目的 地 址 为 224.0.0.1 的 IGMP 查询 数据 包 , 在 数据 包 中 P 多 播 地 址 字段 设置 为 0。 每 个 参 
与 多 播 通信 的 主机 在 收 到 IGMP 查询 数据 包 后 ， 都 需要 发 送 一 个 上 面 所 述 的 IGMP 报告 数据 
fa, IP 多 播 地 址 字段 和 目的 地 址 都 设 为 其 参与 的 多 播 组 的 地 址 。 如 果 一 个 主机 加 入 多 个 多 播 
组 ， 那 么 主机 需要 为 每 个 组 发 送 一 个 报告 数据 包 。 


7.3.3 IGMP 协议 的 实现 


所 有 的 IGMP 数据 包 都 是 以 多 播 的 形式 发 送 的， 因此 实现 时 必须 尽量 减少 数据 包 的 发 送 
以 减少 对 网 络 造成 的 影响 。 为 改善 该 协议 的 效率 ， 有 许多 实现 的 细节 要 考虑 。 

首先 ， 当 一 个 主机 加 入 一 个 多 播 组 而 首次 发 送 IGMP 报告 时 ， 并 不 能 保证 该 报告 被 可 靠 
接收 。 下 一 个 报告 将 在 间隔 一 段 时 间 后 发 送 。 这 个 时 间 间 隔 由 主机 在 0 一 10 秒 的 范围 内 随机 
选择 。 如 果 多 个 应 用 程序 加 入 同一 个 多 播 组 ， 主 机 不 会 为 每 一 个 加 入 的 应 用 程序 发 送 一 个 报 
告 ， 只 会 在 第 一 个 应 用 程序 加 入 时 发 送 报告 。 

其 次 ， 当 一 个 主机 收 到 一 个 从 路 由 器 发 出 的 查询 后 ， 并 不 立即 响应 ， 而 是 经 过 一 定 的 时 
间 间 隔 后 才 发 出 响应 ， 这 个 延迟 的 时 间 是 随机 的 。 在 一 个 物理 网 络 中 的 所 有 主机 将 收 到 同 组 
其 他 主机 发 送 的 所 有 报告 ， 因 为 报告 中 的 目的 地 址 是 那个 组 地 址 。 这 意味 着 如 果 一 个 主机 在 
等 待 发 送 报告 的 过 程 中 ， 却 收 到 了 发 自 其 他 主机 的 相同 组 的 报告 ， 则 该 主机 的 响应 就 可 以 不 
必 发 送 了 。 这 是 因为 多 播 路 由 器 并 不 关心 有 多 少 主机 属于 该 组 ， 而 只 关心 该 组 是 否 还 至 少 拥 
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有 一 个 主机 。 的 确 ， 一 个 多 播 路 由 器 甚至 不 关心 哪个 主机 属于 一 个 多 播 组 ， 它 仅仅 想 知道 在 
该 网 络 中 的 多 播 组 中 是 否 还 至 少 有 一 个 主机 。 在 没有 任何 多 播 路 由 器 的 本 地 物理 网 络 中 ， 仅 
有 的 IGMP 通信 量 就 是 在 主机 加 入 一 个 新 的 多 播 组 时 ， 支 持 多 播 的 主机 所 发 出 的 报告 。 

IGMP 报告 和 查询 数据 包 的 TTL 值 设 置 为 1。 一 个 初始 TTL 为 0 的 多 播 数 据 包 将 被 限制 
在 同一 主机 。 在 默认 情况 下 ， 待 传 多 播 数 据 包 的 TTL 被 设置 为 1， 这 将 使 多 播 数据 包 仅 局 限 
在 同一 子 网 内 传送 。 更 大 的 TTL. 值 能 被 多 播 路 由 器 转发 。 对 发 往 一 个 多 播 地 址 的 数据 包 从 不 
会 产生 ICMP 差错 。 
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UDP 协议 和 下 协议 一 样 ， 也 提供 不 可 靠 的 传递 服务 。 那 么 为 什么 还 需要 UDP 协议 呢 ? 
我 们 知道 PP 协议 中 数据 包 的 最 终 地 址 是 一 个 IP 地 址 ， 也 即 代表 了 一 个 主机 。 但 在 多 任务 的 
操作 系统 中 可 能 同时 会 有 多 个 任务 〈 即 应 用 程序 ) 在 执行 ， 它 们 可 能 都 需要 进行 网 络 通信 。 
这 时 就 出 现 了 一 个 问题 ， 即 收 到 IP 数据 包 的 主机 系统 的 IP 协议 应 该 将 该 数据 包 交 给 哪个 应 
用 程序 进行 处 理 呢 ? 另外 ， 在 第 3 章 讲 到 ， 卫 协议 只 对 IP 头 部 计算 校 验 和 以 保证 头 部 在 传 
输 过 程 中 不 被 改动 , 那么 数据 部 分 的 完整 性 由 谁 来 保证 呢 ? 所 有 这 些 都 决定 了 只 依靠 下 协议 
进行 数据 传递 是 不 够 的 。 


8.1 最 终 目 标的 标识 一 UDP 端口 


上 面 讲 到 在 多 任务 的 操作 系统 中 会 有 多 个 应 用 程序 同时 在 执行 ， 而 仅仅 依靠 IP 协议 的 
IP 地 址 无 法 区 分 一 个 主机 系统 中 的 多 个 应 用 程序 。 因 此 需要 有 一 种 机 制 ， 使 得 数据 包 的 发 送 
方 能 够 指定 该 数据 不 是 发 送 给 目标 主机 中 的 哪 一 个 应 用 程序 的 。 

最 直接 的 一 种 方法 就 是 在 指定 TP 地 址 的 同时 还 指定 接收 该 数据 包 的 应 用 程序 的 进程 id。 
这 样 在 接收 主机 上 的 IP 协议 就 知道 应 该 将 该 数据 包 交 给 哪个 应 用 程序 处 理 了 。 但 这 种 方法 有 
几 个 致命 的 缺点 它 是 不 可 做 到 的 。 第 一 在 大 多 数 操作 系统 中 ,进程 的 建立 与 销毁 是 动态 的 ， 
而 进程 id 的 分 配 也 是 动态 的 。 那 么 同一 个 应 用 程序 在 不 同 的 时 间 其 进程 id 也 有 可 能 是 不 同 
的 。 因此， 发 送 方 根本 就 无 法 知道 他 要 与 其 通信 的 进程 的 id 是 什么 ; 第 二 ， 有 时 需要 在 一 个 
进程 中 实现 多 种 功能 ， 那 么 该 进程 就 需要 对 接收 到 的 数据 包 进 行 区 分 ， 以 识别 它 是 哪 种 功能 
的 数据 包 ; 第 三 ， 我 们 可 能 需要 访问 目标 主机 的 某 种 标准 功能 ， 而 不 需要 知道 实现 这 种 功能 
的 应 用 程序 是 什么 。 因 为 实现 这 种 功能 的 应 用 程序 有 很 多 种 ， 因 此 不 可 能 指定 该 应 用 程序 的 
进程 ia。 所 以 ， 通 过 指定 进程 id 的 方式 来 指定 数据 包 的 最 终 目 标的 做 法 是 不 可 行 的 。 

UDP 协议 采用 的 最 终 目 标的 表示 方法 是 使 用 UDP 端口 ， 每 个 端口 就 是 一 个 最 终 目标 。 
在 每 个 主机 的 TCP/IP 协议 栈 中 ，UDP 协议 有 一 个 端口 集 ， 其 中 每 个 端口 都 用 一 个 整数 进行 
标示 。 可 以 将 一 个 端口 理解 为 一 个 队列 。 在 发 送 一 个 数据 包 时 ， 通 过 指定 该 数据 包 的 目标 IP 
地 址 和 端口 号 来 指定 它 的 最 终 目 标 。 在 接收 方 ,UDP 协议 将 属于 一 个 端口 的 数据 包 放 在 一 个 
队列 当中 。 应 用 程序 在 进行 网 络 通信 之 前 必须 先 申请 一 个 或 多 个 属于 它 自己 的 端口 号 ， 那 么 
所 有 发 往 该 端口 的 数据 包 都 是 发 往 该 应 用 程序 的 。 使 用 这 种 方法 就 能 解决 上 面 提 到 的 几 个 问 
题 。 首 先 ， 端 口号 是 固定 的 ， 可 以 为 不 同 的 功能 分 配 固定 的 端口 号 。 这 样 发 送 方 应 用 程序 就 
只 需要 将 数据 包 发 往 该 固定 端口 。 其 次 ， 一 个 实现 多 个 功能 的 应 用 程序 可 以 申请 多 个 端口 ， 
每 一 个 端口 作 不 同 的 用 途 。 这 样 它 就 可 以 区 分 不 同 端口 的 数据 包 的 不 同 用途 了 。 最 后 对 于 标 
准 的 功能 ， 可 以 预先 分 配 固定 的 端口 号 ， 这 些 端口 号 是 不 能 作为 其 他 作用 的 ， 只 有 实现 了 该 
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标准 功能 的 应 用 程序 可 以 申请 该 端口 号 ， 那 么 访问 该 功能 的 应 用 程序 就 可 以 通过 将 数据 包 发 
往 该 端口 来 访问 该 功能 了 。 


82 UDP 数据 包 格 式 


首先 ， 需 要 指出 的 是 UDP 协议 是 提供 不 可 靠 传递 服务 的 ， 即 UDP 协议 数据 包 可 能 会 丢 
失 ， 失 序 等 ，UDP 协议 不 处 理 数据 包 的 重 发 。 这 一 点 和 了 王 协议 一 样 。 这 就 需要 使 用 UDP 协 
议 的 应 用 程序 自己 处 理 数据 包 的 重 发 ， 顺 序 重组 等 。 那 么 有 的 读者 可 能 会 产生 疑惑 ， 为 什么 
不 让 UDP 协议 提供 可 靠 的 传递 服务 呢 ， 这 样 不 就 减轻 了 应 用 程序 的 负担 吗 ? 这 是 因为 要 提 
供 可 靠 的 传递 服务 需要 采用 一 些 技术 ， 这 会 带 来 额外 的 负担 。 有 的 应 用 程序 可 能 不 能 负担 这 
种 负担 。 关 于 这 一 点 将 在 下 一 章 进行 详细 讨论 。 本 节 看 看 UDP 协议 数据 包 的 格式 ， 并 解释 
它 是 怎样 标示 最 终 目标 并 保证 UDP 数据 包 的 数据 完整 性 的 。 


UDP 数据 包 的 格式 
UDP 数据 包 的 格式 很 简单 ， 如 图 8.1 所 示 。 


0 16 31 
UDP 源 端口 UDP 目标 端口 
UDP 包 长 UDP 校 验 和 


8.1 UDP 数据 包 的 格式 


在 图 8.1 中 源 端口 和 目标 端口 字段 指定 了 两 个 16 长 的 端口 号 ,其 中 源 端 口 字段 是 可 选 的 。 
如 果 指 定 了 该 字段 的 值 ， 它 就 表示 相应 数据 包 应 发 往 的 端口 号 。 如 果 不 使 用 ,应 将 其 设 为 0。 
长 度 字段 表示 整个 UDP 数据 包 的 8 位 字数 ， 包 含 UDP 头 部 和 数据 部 分 。 因 此 ， 该 字段 的 值 
最 小 为 8。 

UDP 校 验 和 字段 是 用 来 保证 UDP 数据 包 的 完整 性 的 。 但 该 字段 是 可 选 的 ， 即 UDP 协议 
可 以 计算 校 验 和 ， 也 可 以 不 计算 ， 没 计算 校 验 和 的 UDP 数据 包 应 该 将 校 验 和 字段 设 为 0。 读 
者 可 能 会 奇怪 ， 为 什么 设置 了 该 字段 而 又 不 使 用 呢 ? 这 是 因为 UDP 协议 的 设计 者 考虑 到 在 
有 的 可 靠 性 很 高 的 网 络 中 ， 传 输 的 数据 几乎 不 会 出 错 ， 这 样 就 可 以 通过 不 计算 UDP 数据 包 
的 校 验 和 来 减少 主机 的 计算 工作 量 。 

UDP 校 验 和 的 计算 方法 与 TP 校 验 和 的 计算 方法 一 样 , 即将 数据 分 为 16 位 长 的 段 然后 计 
算 它们 的 异 或 。 但 UDP 校 验 和 的 计算 不 是 严格 按照 图 8.1 所 示 的 数据 包 格 式 的 数据 包 进行 的 ， 
具体 的 计算 方法 在 8.3 节 解 释 。 


8.3 UDP 校 验 和 的 计算 


UDP 校 验 和 的 计算 不 仅 包含 了 UDP 数据 包 中 的 所 有 数据 还 包括 一 个 称 为 伪 头 部 的 结构 
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和 将 UDP 数据 包 补足 16 位 的 整数 倍 的 一 个 全 为 0 的 8 位 字 。 计 算 校 验 和 时 ，UDP 协议 先 构 
造 该 数据 包 的 一 个 伪 头 部 结构 ， 然 后 将 UDP 数据 包 的 校 验 和 字段 设置 为 0 并 将 其 连接 在 伪 
头 部 后 面 , 将 UDP 数据 包 的 长 度 补足 为 16 位 的 整数 倍 , 最 后 按照 P 协议 校 验 和 的 计算 方法 
对 这 个 新 的 结构 计算 校 验 和 并 将 结果 填 入 校 验 和 字段 。UDP 伪 头 部 和 长 度 补足 部 分 不 会 进行 
传输 ， 其 长 度 也 不 包含 在 UDP 数据 包 长 度 字段 内 。 


8.3.1 UDP 伪 头 部 格式 
UDP 伪 头 部 的 格式 如 图 8.2 所 示 。 


0 8 16 31 
源 IP 地 址 
目的 IP 地 址 
0 协议 代码 oan» UDP 数 据 包 长 度 


图 8.2 UDP 伪 头 部 结构 格式 


源 他 地址 和 目的 下 地 址 字段 包含 了 发 送 该 数据 包 的 源 主机 和 接收 它 的 目的 主机 的 他 地 
址 。 协 议 代码 字段 为 UDP 协议 的 代码 。UDP 数据 包 长 度 字段 就 是 UDP 数据 包 的 UDP AK 
字段 的 值 。 


8.3.2 为 什么 使 用 伪 头 部 


使 用 UDP 伪 头 部 的 目的 是 为 了 让 数据 包 的 接收 者 确定 发 送 和 接收 的 UDP 数据 包 是 来 自 
正确 的 源 地 址 且 该 数据 包 是 发 给 自己 的 。 我 们 知道 在 UDP 数据 包 的 结构 中 只 包含 了 数据 包 
的 源 端口 和 目的 端口 ， 而 没有 包含 源 IP 地址 和 目的 他 地 址 。 因 此 ，UDP 使 用 伪 头 部 结构 来 
计算 校 验 和 。 在 发 送 方 构造 一 个 伪 头 部 结构 与 待 发 送 的 UDP 数据 包 一 起 计算 校 验 和 后 发 送 
给 接收 方 。 在 接收 方 使 用 同样 的 方法 计算 校 验 和 并 与 发 送 方 计算 的 校 验 和 进行 比较 ， 如 果 两 
个 校 验 和 匹配 ， 就 说 明 该 数据 包 是 发 给 本 主机 的 ， 且 数据 传输 没有 出 错 。 


8.4 UDP 数据 包 的 封装 


从 TCP/IP 协议 栈 的 体系 结构 可 以 看 到 UDP 是 出 于 IP 协议 和 应 用 程序 之 间 的 , 图 8.3 说 
明了 UDP 协议 在 整个 TCP/IP 协议 中 的 位 置 。 

从 图 8.3 中 可 以 看 出 ，UDP 协议 位 于 IP 协议 之 上 。 这 就 说 明 UDP 数据 包 是 封装 在 全 数 
据 包 中 进行 传输 ， 即 整个 UDP 数据 包 是 作为 IP 数据 包 的 数据 部 分 被 封装 在 IP 数据 包 中 的 。 
封装 关系 如 图 8.4 所 示 。 

IP 数据 包 的 头 部 有 一 个 协议 字段 ， 该 字段 表明 IP 数据 包 封 装 的 是 上 层 哪 一 种 协议 的 数 
据 包 。 对 于 UDP 数据 包 ， 该 字段 的 值 为 17。 下 面 解释 一 个 使 用 UDP 协议 的 应 用 程序 是 如 何 
将 数据 传输 到 目标 主机 A 的 特定 应 用 程序 的 。 

首先 接收 数据 的 应 用 程序 要 申请 一 个 UDP 端口 号 , 设 为 P。 发送 方 的 应 用 程序 准备 好 数 
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据 后 ， 将 其 交 给 UDP 协议 ， 让 其 将 该 数据 发 送 给 主机 A 的 端口 P。UDP 协议 将 应 用 程序 的 
数据 作为 UDP 数据 包 的 数据 部 分 封装 在 一 个 UDP 数据 包 中 ， 并 将 数据 包 的 目标 端口 字段 设 
置 为 P。UDP 协议 再 将 UDP 数据 包 交 给 IP 协议 处 理 ， 让 其 将 该 数据 包 发 送 到 主机 A。 下 协 
WOK UDP 数据 包 作 为 P 数据 包 的 数据 封装 在 一 个 下 数据 包 中 ， 并 将 目的 地 址 设置 为 A, 将 
协议 字段 设置 为 17， 然 后 将 其 交 给 网 络 层 处 理 并 发 送出 去 。 该 IP 数据 包 可 能 会 经 过 数 个 路 
由 器 ， 并 最 终 到 达 主机 A 的 下 协议 层 。 


UDP 基部 UDP EGE 
应 用 程序 PRK 人 报 文 数据 区 
UDP 
IP | 
x. 
[773 WX WERK 
8.3 UDP 协议 的 层次 图 图 8.4 UDP 数据 包 封装 关系 


主机 A 的 他 协议 发 现 协 议 字 段 为 17, 就 将 IP 数据 包 的 数据 区 交 给 UDP 协议 处 理 。UDP 
协议 发 现 端口 号 为 P, 就 将 UDP 数据 包 的 数据 区 放置 在 端口 P 的 队列 中 。A 的 应 用 程序 从 该 
队列 中 将 数据 取出 进行 处 理 。 


8.5 标准 UDP 端口 


在 讲述 UDP 数据 包 的 格式 时 ， 我 们 注意 到 ， 尽 管 源 端口 字段 是 可 选 的 ， 但 目标 端口 号 
是 必须 指定 。 这 是 因为 目标 主机 的 UDP 协议 必须 知道 端口 号 才 知 道 将 数据 放 入 哪个 队列 中 。 
现在 来 看 看 一 个 应 用 程序 如 何 才能 知道 要 将 数据 发 往 目 标 主机 的 哪个 UDP 端口 。 

一 种 方法 就 是 发 送 方 在 发 送 UDP 数据 包 时 指定 源 端口 字段 ， 应 用 会 接收 该 发 往 端口 的 
数据 包 。 这 样 该 数据 包 的 接受 者 如 果 想 发 送 响应 数据 包 给 该 主机 就 可 以 将 目标 端口 设置 为 该 
数据 包 的 源 端 口 了 。 但 第 一 个 UDP 数据 包 的 发 送 者 如 何 知道 数据 包 的 目标 端口 呢 。 这 可 以 
通过 为 一 些 标准 的 服务 指定 专用 的 UDP 端口 实现 。 表 8.1 是 一 些 常用 的 标准 UDP 端口 及 使 
用 该 端口 的 应 用 程序 应 提供 的 服务 。 


表 5.1 标准 UDP 端口 表 
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描 xk 

字符 产生 服务 

时 间 

主机 名 服务 器 
Whois 

域名 服务 器 
Bootstrap 协议 服务 器 
Bootstrap 协议 客户 端 
TFTP 

网 络 时 间 协 议 


应 用 程序 申请 UDP 端口 号 可 以 采用 两 种 方式 。 第 一 种 就 是 指定 需要 分 配 哪 个 端口 ， 第 
二 种 方法 不 指定 需要 的 端口 , 操作 系统 可 以 随意 分 配 一 个 可 用 的 端口 号 给 该 应 用 程序 。 通常 ， 
如 果 应 用 程序 需要 接收 其 他 主机 的 应 用 程序 发 出 的 第 一 个 数据 包 ， 它 就 需要 采用 第 一 种 方式 
申请 一 个 固定 的 端口 号 ， 且 这 个 端口 号 必须 是 其 他 主机 的 应 用 程序 知道 的 。 否 则 应 用 程序 可 
以 采用 第 二 种 方法 申请 端口 号 ， 并 在 发 出 的 第 一 个 数据 包 中 指定 源 端 口号 。 
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TCP 协议 和 UDP 协议 在 TCP/IP 协议 栈 中 都 处 于 相同 的 层次 ， 位 于 PEZE WHE 
之 下 。 但 和 UDP 仅 提 供 不 可 靠 的 传递 服务 不 同 ，TCP 协议 为 上 层 应 用 提供 面向 连接 的 可 靠 
的 字 节 流传 送 服务 。 在 本 章 将 详细 介绍 TCP 协议 中 的 基本 概念 及 TCP 协议 的 工作 原理 ， 并 
将 UDP 协议 与 TCP 协议 进行 比较 ， 指 出 它们 的 不 同 的 应 用 环境 。 


9.1 TCP 协议 中 的 基本 概念 


TCP 协议 是 一 种 提供 面向 连接 的 可 靠 的 字 节 流 传送 服务 的 协议 。 这 里 有 几 个 关键 的 概 
Z: 面向 连接 、 可 靠 的 、 面 向 字 节 流 。 下 面 将 一 一 解释 这 几 个 概念 。 


9.1.1 面向 连接 的 服务 


和 使 用 UDP 协议 的 应 用 程序 一 样 ， 使 用 TCP 协议 的 应 用 程序 也 需要 有 一 种 机 制 指定 协 
议 数据 的 最 终 目 标 。 同 样 ，TCP 也 使 用 端口 的 概念 来 标识 协议 数据 的 最 终 目 标 。TCP 端口 号 
也 是 一 个 整数 。 

在 第 8 章 提 到 UDP 的 端口 实际 上 就 是 一 个 队列 ， 所 有 发 往 该 端口 的 数据 包 都 在 该 队列 
上 等 待 同一 个 应 用 程序 的 处 理 。 但 在 TCP 协议 中 ， 一 个 TCP 端口 并 不 能 最 终 决定 处 理 TCP 
协议 数据 的 应 用 程序 是 谁 。 因 为 TCP 是 面向 连接 的 ， 所 以 TCP 采用 连接 来 标识 数据 的 最 后 
处 理 者 。 在 TCP 协议 中 一 个 连接 由 两 个 地 址 、 端 口 对 表示 。 例 如 ，“〔192.168.8.21, 20) 标识 
主机 192.168.8.21 上 的 20 号 TCP 端口 ， 那 么 《192.168.8.21, 20) - (192.168.8.22, 29) 就 是 
一 个 连接 。 从 这 种 表示 方法 可 以 看 出 , 一 个 TCP 连接 由 两 个 端点 组 成 。 还 有 一 点 需要 强调 的 
Æ, TCP 的 一 个 端口 可 以 为 多 个 连接 复 用 。 例如 连接 (192.168.8.21, 20) - (192.168.8.22, 29) 
Al (192.168.8.37, 147) - (192.168.8.22, 29) 可 以 同时 存在 。 这 里 主机 192.168.8.22 的 29 号 
端口 就 同时 成 为 了 两 个 连接 的 端点 。 尽 管 两 个 连接 同时 使 用 一 个 TCP 端口 ， 但 两 个 TCP 连 
接 的 数据 的 处 理 程序 可 能 并 不 是 同一 个 应 用 程序 。 

从 上 述说 明 可 以 看 出 ，TCP 协议 是 使 用 连接 作为 TCP 数据 处 理 程序 的 处 理 者 的 。 而 且 
TCP 的 连接 由 两 个 端点 组 成 , 这 就 决定 了 使 用 TCP 协议 传输 数据 只 能 两 两 之 间 进 行 通信 , 无 
法 使 用 第 7 章 中 的 广播 和 多 播 通信 。 


9.1.2 可靠 的 服务 


从 TCP/IP 协议 栈 结构 图 可 以 看 出 ，TCP 协议 是 位 于 他 层 之 上 的 。TCP 协议 数据 的 传递 
需要 依赖 于 IP 协议 。 而 我 们 一 直 都 强调 IP 协议 提供 的 是 不 可 靠 的 传递 服务 ， 即 IP 数据 包 可 
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ERER, KF. BAS. M TCP 要 提供 的 服务 是 一 种 可 靠 的 服务 ， 即 交 给 TCP 协议 传送 
的 数据 必须 按 顺 序 到 达 目标 应 用 程序 。 读 者 可 能 会 奇怪 ， 在 下 层 不 可 靠 的 网 络 的 基础 上 如 何 
能 够 提供 可 靠 的 传输 服务 呢 ? 这 是 通过 使 用 超时 重 发 机 制 实现 的 ， 即 接收 方 在 收 到 发 送 方 的 
数据 后 应 该 给 发 送 方 发 送 一 个 确认 ， 发 送 方 在 发 出 数据 后 会 等 待 接收 方 的 确认 ， 在 收 到 确认 
之 前 不 会 发 送 下 一 个 数据 。 如 果 等 待 一 定 的 时 间 之 后 还 没有 收 到 确认 就 将 刚 发 送 的 数据 进行 
重 发 ， 直 到 收 到 确认 或 最 后 重 发 次 数 试 完 为 止 。 图 9.1 是 这 种 重 发 机 制 的 示意 图 。 


发 送 方 接收 方 


发 送 数据 1 
接收 数据 1 
发 送 确 认 1 
接收 确认 1 
发 送 数据 2 
接收 数据 2 
发 送 确认 2 
接收 确认 2 
发 送 数据 3 


重 发 数据 3 
接收 数据 3 
发 送 确认 3 
接收 确认 3 


91 确认 重 发 机 制 示意 图 


从 图 9.1 中 可 以 看 出 ， 发 送 方 发 出 一 个 数据 后 总 是 要 等 接收 到 接收 方 发 出 的 对 该 数据 的 
确认 后 才 会 发 送 下 一 个 数据 。 如 果 发 出 数据 后 等 待 一 定 的 时 间 还 没有 接收 到 接收 方 的 确认 
(如 图 中 第 一 次 发 送 数 据 3) ， 发 送 方 就 认为 该 数据 已 丢失 ， 并 重新 发 送 该 数据 。 通 过 这 种 
机 制 确实 能 够 提供 可 靠 的 传输 服务 ， 除 非 发 送 者 和 接收 方 之 间 的 网 络 连接 已 经 断 开 。 这 种 机 
制 保证 了 丢失 的 数据 包 可 以 通过 再 次 发 送 增加 其 到 达 目 标的 可 能 性 。 但 在 这 种 机 制 中 还 有 一 
个 问题 。 因 为 发 送 方 发 送 数据 后 过 了 一 定 的 时 间 没有 收 到 确认 就 会 重 发 数据 。 但 有 时 候 数据 
包 不 是 真 的 丢失 了 ， 而 是 网 络 传输 的 延 时 太 长 ， 以 至 于 在 很 久之 后 才 到 达 目 标 主机 。 这 样 的 
话 目标 主机 就 会 收 到 2 次 相同 的 数据 ， 而 发 送 方 也 会 收 到 同一 数据 的 两 次 确认 。 那 么 怎样 区 
分 收 到 的 数据 和 确认 是 否 是 同一 个 呢 ? 通常 的 做 法 就 是 在 数据 包 中 记录 一 个 数据 的 序列 号 ， 
相同 的 数据 如 果 发 送 多 次 都 使 用 同一 个 序列 号 。 接 收 方 发 送 确认 数据 包 时 也 要 注 明 是 对 哪 一 
个 序列 号 的 数据 包 的 确认 。 就 像 图 9.1 中 的 1、2 和 3 就 分 别 表示 不 同 数据 的 序列 号 。 

TCP 协议 就 是 通过 超时 重 发 机 制 来 提供 可 靠 服务 的 。 但 从 图 9.1 中 可 以 看 出 ， 这 种 机 制 
的 效率 是 很 低 的 ， 因 为 在 双方 等 待 的 过 程 中 ， 网 络 非常 空闲 。TCP 使 用 一 种 称 为 滑动 窗口 的 
机 制 可 以 提高 网 络 的 利用 率 ， 从 而 提供 数据 传输 的 效率 同时 又 能 保证 可 靠 性 ， 我 们 将 在 后 面 
讲述 这 种 机 制 。 
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9.1.3 面向 字 节 流 的 传送 服务 


AE TCP 传输 数据 的 机 制 是 什么 ， 它 向 上 层 应 用 程序 提供 的 传输 服务 是 面向 字 节 流 的 。 
TCP 协议 将 应 用 程序 需要 传输 的 数据 理解 为 按 顺 序 排列 的 二 进 制 位 ， 并 按 8 位 字 分 隔 ， 形 成 
有 序 的 S 位 字 流 ， 也 称 为 字 节 流 。 发 送 方 将 数据 以 字 节 流 的 顺序 递交 给 下 层 的 TCP 协议 进行 
传输 ， 接 收 方 的 TCP 协议 会 将 数据 以 相同 的 字 节 流 顺 序 交 给 接收 方 的 程序 。 虽 然 TCP 协议 
数据 的 传输 最 终 是 以 数据 包 的 形式 进行 的 , 但 TCP 协议 在 组 织 数据 包 时 并 不 会 关心 数据 的 结 
构 ， 而 是 以 它 觉得 合适 的 方式 将 数据 进行 分 割 。 因 此 发 送 方 的 应 用 程序 将 一 个 完整 结构 的 数 
据 组 织 成 字 节 流 一 次 交 给 TCP 协议 传输 后 , 接收 方 的 应 用 程序 通过 一 次 收取 动作 可 能 无 法 获 
得 完整 的 记录 数据 , 因为 TCP 协议 可 能 将 该 数据 进行 了 分 割 , 而 目前 到 达 的 数据 可 能 只 是 整 
个 记录 数据 的 一 部 分 。 因 此 接受 方 的 应 用 程序 在 接收 数据 时 必须 自己 识别 记录 的 结构 ， 如 果 
发 现 一 次 收取 的 数据 不 是 完整 的 记录 就 需要 进行 多 次 收取 并 将 多 次 收集 的 数据 还 原 成 完整 
的 记录 。 
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TCP 协议 向 应 用 程序 提供 的 服务 是 面向 字 节 流 的 , 应 用 程序 不 用 关心 这 些 字 节 流 是 怎样 
进行 传输 的 。 但 TCP 数据 的 传输 是 通过 IP 协议 进行 的 ，IP 协议 的 传输 单位 是 人 P 数据 包 。 因 
为 用 户 提供 的 字 节 流 数 据 可 能 很 大 , 而 一 个 人 P 数据 包 所 能 容纳 的 数据 是 有 限 的 (至少 在 理论 
上 受到 IP 数据 包头 部 中 包 长 字段 最 大 值 的 限制 ) ， 因 此 TCP 协议 必须 将 字 节 流 数据 进行 分 
割 并 组 织 成 瑟 数据 包 进 行 传输 , 在 目标 主机 的 TCP 协议 将 这 些 分 割 的 数据 再 组 织 成 数据 流 。 
TCP 协议 数据 包 有 自己 的 头 部 和 数据 区 ， 一 个 TCP 数据 包 成 为 段 。 本 节 来 看 看 TCP 数据 段 
的 具体 格式 ， 并 对 其 中 部 分 字段 的 意义 进行 说 明 ， 而 其 他 一 些 字段 的 意义 将 在 后 面 讲 到 TCP 
协议 的 各 种 机 制 时 进行 解释 。 


9.2.1 TCP 数据 段 的 格式 


图 9.2 就 是 TCP 数据 段 的 具体 格式 。 
0 4 10 16 24 31 
源 端口 目标 端口 
序列 号 
确认 号 
头 部 长 保留 代码 位 窗口 
校 验 和 紧急 指针 
TCP 选 项 (如 果 有 ) 
数据 
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源 端 口 和 目标 端口 用 于 指定 发 送 方 和 接受 方 的 TCP 端口 号 .和 UDP 协议 不 同 的 是 , TCP 
段 中 源 端 口号 必须 指定 。 这 是 因为 我 们 提 到 过 TCP 是 面向 连接 的 ， 一 个 TCP 连接 由 发 送 方 
和 接收 方 的 IP 地 址 和 TCP 端口 号 组 成 。 因 为 一 个 TCP 端口 号 可 以 为 不 同 的 连接 所 重用 ， 所 
以 两 个 端口 号 中 缺少 任何 一 个 都 无 法 确定 该 数据 段 所 属 的 TCP 连接 , 也 就 无 法 确定 处 理 数据 
的 应 用 程序 了 。 

头 部 长 字段 的 值 是 32 位 计 的 TCP 段 头 部 的 长 度 。 因为 TCP 头 部 有 一 个 选项 字段 是 可 选 
的 ， 所 以 需要 这 个 字段 来 区 分 TCP 头 部 和 数据 区 。 

另外 ， 头 部 有 一 个 代码 位 字段 ， 该 字段 的 长 度 是 6 位， 这 6 位 从 前 往 后 分 别称 为 URG、 
ACK, PSH, RST, SYN AI FIN. 3X 6 位 的 设置 代表 了 对 段 头 部 其 他 字段 意义 的 解释 。 在 后 
面 讲 到 TOP 协议 的 各 种 相关 机 制 时 再 一 一 说 明 这 些 位 的 作用 。 由 于 序列 号 和 确认 号 字段 要 到 
后 面 才 解 释 ， TCP 连接 的 建立 要 使 用 重 发 与 确认 机 制 ， 这 就 涉及 到 序列 号 的 初始 化 和 确认 
问题 。 在 讲 到 TCP 连接 的 建立 时 会 忽略 这 些 问题 ， 直 到 讲 到 TCP 数据 传输 机 制 时 再 详细 解 
R. 


9.22 TCP 校 验 和 的 计算 


TCP 数据 段 头 部 校 验 和 字段 的 长 度 为 16 位 ， 它 的 作用 是 用 来 保证 传输 过 程 中 TCP 数据 
段 的 完整 性 。 校 验 和 在 发 送 方 计算 好 并 填 入 校 验 和 字段 。 接 受 方 以 同样 的 方法 计算 数据 段 的 
校 验 和 并 与 发 送 方 计算 的 进行 比较 ， 如 果 一 致 就 说 明 数 据 段 在 发 送 过 程 中 没有 被 改动 ， 否 则 
就 被 改动 了 。 只 有 发 送 方 和 接收 方 计算 的 校 验 和 一 致 的 数据 段 才 会 被 接受 。 

和 UDP 使 用 UDP 伪 头 部 计算 数据 包 校 验 和 一 样 ，TCP 校 验 和 的 计算 不 仅 包含 了 TCP 
数据 段 中 的 所 有 数据 还 包括 一 个 称 为 伪 头 部 的 结构 和 将 TCP 数据 段 补足 16 位 的 整数 倍 的 一 
个 全 为 0 的 8 位 字 。 计 算 校 验 和 时 ，TCP 协议 先 构造 该 数据 段 的 一 个 伪 头 部 结构 ， 然 后 将 
TCP 数据 段 的 校 验 和 字段 设置 为 0 并 将 其 连接 在 伪 头 部 后 面 ,最 后 将 TCP 数据 段 的 长 度 补足 
为 16 位 的 整数 倍 。 最 后 按照 IP 协议 校 验 和 的 计算 方法 对 这 个 新 的 结构 计算 校 验 和 并 将 结果 
填 入 校 验 和 字段 。TCP 伪 头 部 和 长 度 补足 部 分 不 会 进行 传输 。 

TCP 伪 头 部 的 格式 如 图 9.3 所 示 。 


0 8 16 31 
源 IP 地 址 
目的 IP 地 址 
0 协议 代码 (6) TCP 数 据 段 长 度 
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源 下 地 址 和 目的 下 地址 字段 包含 了 发 送 该 数据 段 的 源 主机 和 接收 它 的 目的 主机 的 下 地 
址 。 协 议 代码 字段 为 TCP 协议 的 代码 。TCP 数据 段 长 度 字段 就 是 TCP 数据 段 长 度 ， 不 包括 
伪 头 部 和 补足 部 分 的 长 度 。 

使 用 TCP 伪 头 部 的 目的 是 为 了 让 数据 段 的 接收 者 确定 发 送 和 接收 的 TCP 数据 段 是 来 自 
正确 的 源 地 址 且 该 数据 段 是 发 给 自己 的 。 我 们 知道 在 TCP 数据 段 的 结构 中 只 包含 了 数据 段 的 
源 端口 和 目的 端口 ， 而 没有 包含 源 IP 地 址 和 目的 IP 地 址 。 因 此 ，TCP 使 用 伪 头 部 结构 来 计 
算 校 验 和 。 在 发 送 方 构造 一 个 伪 头 部 结构 与 待 发 送 的 TCP 数据 段 一 起 计算 校 验 和 后 发 送 给 接 
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收 方 。 在 接收 方 使 用 同样 的 方法 计算 校 验 和 并 与 发 送 方 计算 的 校 验 和 进行 比较 ， 如 果 两 个 校 
验 和 匹配 ， 就 说 明 该 数据 包 是 发 给 本 主机 的 ， 且 数据 传输 没有 出 错 。 
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TCP 协议 是 面向 连接 的 传输 协议 , 一 个 TCP 连接 由 发 送 方 的 TP 地 址 与 TCP 端口 号 和 接 
受 方 的 他 地 址 与 TCP 端口 号 标识 。 建 立 一 个 TCP 连接 的 作用 就 是 让 发 送 方 和 接收 方 都 做 好 
准备 , 准备 好 之 后 就 要 开始 进行 数据 传输 了 。 在 本 节 中 , 将 解释 TCP 连接 的 建立 与 关闭 过 程 。 


9.3.1 被 动 打开 与 主动 打开 


在 第 8 章 中 讲 到 UDP 端口 时 讲 到 第 一 个 发 送 UDP 数据 包 的 应 用 程序 必须 知道 接受 方 的 
UDP 端口 号 ， 且 接收 方 的 应 用 程序 必须 已 经 在 等 待 该 UDP 端口 上 的 数据 。 这 样 ， 使 用 UDP 
的 通信 才能 进行 。 这 说 明 一 个 使 用 UDP 进行 通信 的 最 低 要 求 ， 即 必须 存在 一 个 主动 方 和 一 
个 被 动 方 。 被 动 方 的 端口 必须 是 主动 方 和 被 动 方 已 经 约定 的 ， 主 动 方向 被 动 方 发 送 第 一 个 数 
据 并 告诉 被 动 方 自己 的 端口 。 

建立 TCP 连接 也 一 样 。 因 为 TCP 连接 的 建立 过 程 也 是 通过 连接 的 两 方 之 间 进 行 消息 传 
输 进行 ， 这 就 要 必定 有 第 一 个 消息 (连接 请 求 ) 的 发 送 。 发 送 连接 请 求 的 是 主动 方 ， 等 待 连 
接 请 求 的 就 是 被 动 方 。 主 动 方 发 出 连接 请 求 后 ， 只 有 被 动 方 已 做 好 接收 该 请 求 的 准备 后 面 的 
过 程 才能 够 继续 进行 。 

应 用 程序 向 操作 系统 申请 一 个 TCP 端口 并 做 好 等 待 其 他 主机 的 连接 请 求 的 过 程 称 为 TCP 
连接 的 被 动 打开 。 相反 , 应 用 程序 向 操作 系统 申请 一 个 TCP 端口 并 主动 向 其 他 主机 发 出 连接 请 
求 的 过 程 称 为 主动 打开 。 被动 打 开 的 连接 只 有 在 接收 到 其 他 主机 的 连接 请 求 后 才 会 产生 一 个 新 
的 连接 ， 而 如 果 还 有 其 他 主机 向 该 被 动 打开 的 连接 发 出 连接 请 求 又 会 产生 新 的 连接 。 


9.3.2 三 次 握手 建立 TCP 连接 


所 谓 的 三 次 握手 就 是 要 有 三 次 连接 信息 的 发 送 /接收 过 程 .TCP 连接 的 建立 需要 进行 三 
连接 信息 的 发 送 /接收 ， 如 图 9.4 所 示 。 

三 次 握手 的 目的 主要 在 于 同步 连接 双方 发 送 数据 的 初始 序列 号 。 首 先 ， 连 接 的 主动 打开 
方 〈 即 连接 请 求 方 ) 向 被 动 打开 方 〈 即 连接 接受 方 ) 发 送 一 个 TCP 数据 段 ， 该 TCP 段 通常 
不 包含 数据 区 ， 并 将 代码 位 中 SYN 位 置 1 设 在 序列 号 字段 设置 一 个 初始 序列 号 。 被 动 打开 
方 接收 到 这 个 连接 请 求 段 后 ， 向 主动 打开 方 发 送 一 个 TCP 段 。 将 ACK 位 置 1， 表 示 已 经 收 
到 了 主动 打开 方 的 连接 请 求 。 被 动 打开 方 还 会 将 SYN 位 置 1 并 在 序列 号 字段 设置 自己 的 初 
始 序 列 号 。 主 动 打开 方 接收 到 被 动 打开 方 的 TCP 段 之 后 会 发 送 一 个 ACK 给 被 动 打开 方 ， 接 
收 方 接收 到 该 数据 段 后 连接 的 建立 就 完成 了 。 现 在 可 以 开始 传输 数据 了 。 

虽然 上 述 过 程 中 是 一 个 主动 方向 被 动 方 发 起 连接 , 但 TCP 连接 也 有 可 能 是 在 两 个 主动 打 
开 方 之 间 建 立 的 。 图 9.5 就 说 明了 该 过 程 。 
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主动 打 开 A 方 主动 打 ABA 
RBY 
发 BHS YN 
接收 SYN 接 WARS YN 
发送 scd RB 
SYN+ACK 发 送 SYNACK 
SYMACK 
接收 
接 tery 
mE SYMACK 接 愧 的 
发 送 ACK| R BARJAC SYNACK 
发 BBA CK 
接收 ACK 接 Wana CK 
接 愧 的 A C 
图 9.4 TCP 建立 连接 的 三 次 握手 过 程 图 9.5 两 个 主动 打开 连接 建立 的 过 程 


需要 注意 的 是 ， 图 9.5 中 A 和 B 发 送 的 SYN 和 SYN+ACK 段 中 的 序列 号 字段 应 该 是 相 
同 的 ， 否 则 接收 方 就 不 知道 它 的 初始 序列 号 是 什么 了 。 

最 后 要 提 到 的 是 ,一般 建立 连接 的 TCP 段 中 是 不 携带 数据 的 ， 即 数据 区 为 空 。 但 这 并 不 
说 明 这 些 段 中 不 能 携带 数据 。 如 果 上 述 的 各 种 TCP 段 中 携带 了 数据 ， 段 的 接收 方 TCP 就 必 
须 先 将 这 些 数据 保存 下 来 ， 等 连接 建立 后 就 可 以 迅速 递交 给 上 层 应 用 程序 处 理 了 。 


9.3.3 TCP 连接 的 关闭 


TCP 连接 建立 之 后 就 可 以 开始 传输 数据 了 ， 在 所 有 需要 传输 的 数据 传输 完 之 后 ， 就 需要 
将 TCP 连接 关闭 ， 以 释放 为 连接 使 用 的 资源 。 


TCP 连接 是 一 种 全 双 工 的 连接 ， 即 一 个 Maa MAB 
TCP 连接 的 两 个 端点 之 间 可 以 同时 发 送 和 接 发 送 FIN 
收 数据 ， 而 不 是 每 一 个 时 刻 只 能 有 一 个 端点 发 — 
送 数据 可 以 假设 每 个 TCP 连接 中 都 有 两 个 管 发 送 ACK 


道 ， 它 们 的 传输 方向 是 相反 的 。 这 样 就 能 实现 
双向 的 数据 传输 ,因此 TCP 连接 的 关闭 就 出 现 
了 一 个 半 关 闭 的 概念 。 所谓 半 关 闭 的 意思 就 是 


接收 ACK 


只 关闭 一 个 方向 的 数据 传输 ， 另 一 个 方向 的 数 een 
据 传输 还 是 可 以 继续 的 ， 即 只 关闭 了 其 中 的 一 接 Wm 
个 方向 的 管道 。 发 送 ACK| 

这 样 关闭 一 个 TCP 连接 就 需要 4 个 步 又， Baa 
如 图 9.6 所 示 。 


在 图 9.6 H, 端点 A 先 关闭 了 连接 。 这样， 
MWA RIE B 的 数据 就 完成 了 。A 通过 向 B 发 
送 一 个 TCP 段 并 将 段 中 的 FIN 位 置 1 来 关闭 连接 中 从 A 到 B 的 管道 。 在 B 收 到 该 数据 段 之 
Ji, B 会 发 送 一 个 ACK 段 给 A。 但 B 不 一 定 会 立刻 关闭 从 B 到 A 的 管道 。 因为 B 可 能 还 有 


图 9.6 TCP 连接 的 关闭 
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数据 需要 发 送 给 A。 只 有 在 B 的 数据 传输 完 后 B 的 应 用 程序 才 会 关闭 该 连接 。 这 时 B 通过 
将 发 往 A 的 数据 段 中 的 FIN 置 1 来 通知 A 所 有 数据 已 发 送 完毕 。A 发 送 一 个 ACK 段 给 B。 
这 样 整个 TCP 连接 就 关闭 了 。 

上 面 的 连接 关闭 方式 是 在 所 有 数据 传输 完 后 正常 关闭 连接 的 方式 , 但 并 不 是 所 有 的 时 候 
都 能 向 上 述 那 样 “ 礼 貌 ” 地 关闭 连接 。 通常 在 发 生 异 常 时 , 一 方 可 能 需要 立即 关闭 TCP 连接 ， 
而 无 法 等 待 对 方 的 数据 传输 完成 。 这 种 情况 下 , 要 关闭 连接 的 一 方向 对 方 发 送 一 个 RST 位 置 
ALA TCP 段 ， 并 不 再 等 待 该 段 的 ACK， 直 接 将 连接 关闭 。 在 另 一 方 ， 收 到 该 数据 段 后 也 
直接 将 连接 关闭 。 与 上 面 的 关闭 连接 的 方式 相 比 ， 这 种 方式 要 “野蛮 ”得 多 。 这 种 连接 的 关 
闭 方式 通常 称 为 复位 。 


9.3.4 TCP 连接 状态 迁移 


因为 TCP 协议 的 连接 从 建立 到 关闭 的 整个 过 程 中 , 在 不 同 的 时 候 收 到 数据 段 会 有 不 同 的 
处 理 , 可 以 用 连接 的 状态 来 表示 这 些 不 同 的 时 间 , 并 使 用 状态 迁移 图 来 说 明 TCP 在 各 种 状态 
下 对 各 种 数据 段 的 处 理 方式 。 这 样 有 助 于 理解 TCP 连接 的 建立 与 关闭 过 程 。 图 9.7 就 是 这 样 
一 个 TCP 连接 的 状态 迁移 图 。 


收 SYN/ 发 SYN+ACK SYN ^W KRST 


收 SYN+ACK/ 发 
ACK 


最 后 的 | WACK 
GEES 


图 9.7 TCP 连接 状态 迁移 图 


TCP/IP 协议 及 网 络 编程 技术 


在 图 9.7 中 ， 圆 表示 连接 状态 ， 箭 头 表示 状态 的 迁移 。 箭 头 线 旁 的 标签 标识 发 生 该 迁移 
时 收 到 的 数据 段 及 对 该 数据 段 作出 的 反应 。 

从 图 9.7 中 可 以 看 出 ， 一 个 TCP 连接 可 以 有 11 种 不 同 的 状态 。 其 中 左下 角 的 四 个 状态 
是 应 用 程序 主动 关闭 〈 即 先 发 送 FIN 数据 段 ) 经 过 的 状态 ， 右 边 虚 框 中 的 两 个 状态 是 被 动 关 
闭经 过 的 状态 。 

计时 等 待 状态 也 称 为 2MSL 等 待 状态 。 每 个 具体 TCP 实现 必须 选择 一 个 TCP 段 最 大 生 
存 时 间 MSL (Maximum Segment Lifetime) 。 它 是 任何 TCP 段 被 丢弃 前 在 网 络 内 的 最 长 时 间 。 
这 个 时 间 是 有 限 的 ， 因 为 TCP 段 以 他 数据 包 在 网 络 内 传输 ,而 他 数据 包 则 有 限制 其 生存 时 
间 的 TTL 字段 。MSL 通常 为 2min。 对 MSL 处 理 的 原则 是 : 当 TCP 执行 一 个 主动 关闭 ， 并 
发 回 最 后 一 个 ACK， 该 连接 必须 在 计时 等 待 状态 停留 的 时 间 为 2 倍 的 MSL。 这 样 可 让 TCP 
再 次 发 送 最 后 的 ACK 以 防止 这 个 ACK 丢失 ( 另 一 端 超时 并 重 发 最 后 的 FIN) 。 这 种 2MSL 
等 待 的 另 一 个 结果 是 这 个 TOP 连接 在 2MSL 等 待 期 间 ， 定 义 这 个 连接 的 端口 不 能 再 被 使 用 。 


9.4 TCP 协议 数据 的 传送 与 流量 控制 


本 节 具 体 介绍 TCP 协议 的 数据 传输 与 流量 机 制 ， 将 涉及 到 字 节 流 的 分 段 、TCP 的 确认 
重 发 机 制 、 超 时 的 判断 及 紧急 数据 的 传输 等 。 


9.4.1 FRASER 


因为 TCP 向 应 用 程序 提供 的 是 面向 字 节 流 的 传输 服务 , 所 以 应 用 程序 可 以 随意 地 向 应 用 
程序 提交 字 节 流 数 据 。 极 端的 情况 是 应 用 程序 每 次 仅 提交 一 个 字 节 的 数据 让 TCP 协议 进行 传 
输 。 如 果 TCP 协议 每 次 收 到 应 用 程序 提交 的 数据 都 组 织 一 个 或 多 个 数据 段 进 行 传输 ， 而 不 管 
数据 的 多 少 ， 那 么 在 用 户 每 次 都 提交 少量 数据 而 提交 的 次 数 很 多 时 数据 的 传输 效率 是 很 低 
的 。 

为 此 TCP 协议 采用 缓冲 的 办 法 , 这 就 类 似 于 操作 系统 的 写 文件 操作 。 当 应 用 程序 打开 一 
个 文件 进行 写 操作 时 ， 操 作 系统 就 为 该 文件 提供 了 一 个 缓冲 区 。 应 用 程序 写 往 该 文件 的 数据 
都 先 存放 在 该 缓冲 区 ， 并 没有 真正 的 写 到 文件 中 。 只 有 在 缓冲 区 已 满 或 者 应 用 程序 显 式 地 要 
求 将 数据 写 入 文件 时 ， 缓 冲 区 中 的 数据 才 会 写 入 磁盘 文件 中 。TCP 使 用 的 是 同样 的 方法 。 应 
用 程序 提交 给 TCP 协议 的 数据 会 存放 在 一 个 缓冲 区 中 ， 并 没有 真正 地 发 送 到 连接 的 另 一 端 。 
只 有 在 合适 的 时 候 或 者 应 用 程序 显 式 地 要 求 将 数据 发 送出 去 时 TCP 才 会 将 数据 组 织 成 合适 
的 数据 段 发 送出 去 。 至 于 TCP 要 等 到 缓冲 区 聚集 了 多 少数 据 才 开始 发 送 ， 一 般 要 根据 TCP 
协议 确定 的 最 大 段 长 度 决定 。 

我 们 知道 TCP 数据 段 是 封装 在 IP 数据 包 中 进行 传输 的 ， 从 理论 上 讲 ，TCP 数据 段 的 最 
大 长 度 加 上 IP 数据 包头 的 长 度 不 能 超过 65 535 个 8 位 字 。 但 实际 上 的 TCP 数据 段 的 最 大 长 
度 要 远 远 少 于 这 个 值 ， 因 为 它 要 受到 许多 其 他 因素 的 影响 。 

首先 ， 我 们 在 第 3 章 中 提 到 IP 数据 包 的 分 片 问题 。 因 为 IP. 协议 的 数据 包 是 封装 在 底层 
的 物理 网 络 数据 帧 中 进行 传输 的 ， 而 很 多 物理 网 络 都 对 数据 帧 的 最 大 长 度 有 限制 ， 且 通常 都 
比 正 数据 包 的 理论 最 大 长 度 小 的 多 。 所 以 ， 如 果 一 个 IP 数据 包 太 大 就 需要 将 其 分 成 多 个 较 
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小 的 能 够 封装 在 一 个 数据 帧 中 的 小 数据 包 中 进行 传输 。 这 样 做 是 不 得 已 的 ， 因 为 这 会 引起 几 
个 问题 : 第 一 , 因为 大 的 数据 包 要 分 解 成 小 的 数据 包 , 在 目的 地 又 要 重新 组 合成 大 的 数据 包 ， 
且 在 传输 过 程 中 需要 对 每 个 数据 包 进行 路 由 。 所 有 这 些 都 影响 了 数据 传输 的 效率 。 第 二 ， 因 
为 分 成 多 个 分 片 的 数据 包 必 须 在 目的 地 进行 重组 ， 所 以 这 些 分 片 一 个 都 不 能 少 ， 必 须 全 部 到 
达 目 的 地 ， 如 果 有 一 个 丢失 那么 所 有 的 分 片 都 要 重新 进行 传输 。 因 此 分 片 增加 了 传输 失败 的 
几率 。 所 以 在 进行 数据 传输 时 应 该 将 TCP 数据 段 的 大 小 控制 在 合适 的 范围 ,使 得 它 能 够 在 最 
终 封装 在 IP 数据 包 中 之 后 能 通过 一 个 数据 帧 进行 传输 。 

另外 还 有 一 个 因素 限制 了 TCP 数据 段 的 最 大 长 度 。 因 为 网 络 上 的 主机 系统 的 计算 能 力 和 
资源 的 差别 可 能 是 很 大 的 。 大 型 服务 器 的 内 存 数量 可 能 是 几 个 GB， 而 一 些 嵌 入 式 系统 的 内 
存 可 能 只 有 几 个 KB。 如 果 能 力 相差 如 此 悬殊 的 系统 之 间 进 行 通信 ， 就 必须 让 能 力 强 的 一 方 
知道 能 力 弱 方 所 能 接受 的 包 的 最 大 长 度 ， 以 免 一 个 过 大 的 数据 包 将 该 主机 系统 淹没 。 

从 以 上 分 析 中 可 以 看 出 ，TCP 数据 段 最 优 的 长 度 就 是 在 使 得 IP 数据 包 无 需 分 片 且 接收 
方 能 够 接收 的 情况 下 , 尽 可 能 在 一 个 段 中 多 传输 数据 。 为 了 让 发 送 方 知道 接收 方 的 接收 能 力 ， 
TCP 使 用 了 一 个 选项 。 在 建立 连接 时 ， 连 接 的 任何 一 方 都 可 以 在 建立 连接 的 段 中 包含 一 个 最 
大 数据 段 长 选项 ， 用 以 通知 对 方 自己 能 够 接收 的 最 大 


数据 包 的 长 度 。 选 项 的 格式 如 图 9.8 所 示 。 类 型 | 长 度 [选项 数据 | 
TCP 选项 通常 由 3 部 分 组 成 : 类 型 、 长 度 和 选项 

数据 ， 但 有 的 只 有 类 型 字段 。 类 型 字段 的 长 度 是 8 位 ， 2 4 最 大 段 长 

长 度 字段 的 长 度 也 是 8 位 。 长 度 字段 的 值 表示 整个 选 Fos TCP 选项 格式 


项 部 分 的 长 度 ， 而 不 是 只 选项 数据 字段 的 长 度 。 最 大 
段 长 选项 的 类 型 代码 为 2， 选 项 数据 字段 的 长 度 为 16 位 ， 所 以 整个 选项 的 长 度 为 4。 

虽然 要 确定 接收 方 的 接收 能 力 很 容易 ， 但 要 确定 从 发 送 方 到 接收 方 之 间 的 网 络 的 最 小 
MTU 却 是 一 件 很 困难 的 事情 。 首 先 , 由 于 TCP 处 于 IP EZE, 它 无 法 知道 底层 网 络 的 MTU. 
其 次 ，IP 数据 包 的 传输 路 径 是 动态 的 ， 即 同一 个 TCP 连接 的 数据 段 封 装 成 的 数据 包 可 能 会 
通过 不 同 的 路 径 到 达 接 收 方 。 因此 , 发 送 方 的 TCP 无 法 得 知 要 发 送 的 数据 段 会 从 什么 路 径 进 
行 传输 ， 也 就 无 法 确定 该 路 径 上 的 MTU T. 


9.4.2 ”滑动 窗口 机 制 


在 9.1.2 节 提 到 TCP 协议 是 通过 确认 重 发 机 制 来 在 不 可 靠 的 他 协议 的 基础 上 提供 可 靠 的 
传输 服务 的 。 但 当时 所 介绍 的 确认 重 发 机 制 是 一 种 低 效率 的 机 制 , 因为 TCP 在 等 待 数 据 或 确 
认 时 网 络 是 很 空闲 的 。 实际 上 TCP 使 用 的 确认 重 发 机 制 是 一 种 称 为 滑动 窗口 的 机 制 。 在 本 节 
中 先 简单 说 明基 本 的 滑动 窗口 机 制 的 原理 ， 然 后 再 具体 说 明 TCP 协议 中 使 用 的 滑动 窗口 机 
制 。 
9.4.2.1 基本 滑动 窗口 机 制 


简单 的 确认 重 发 机 制 之 所 以 效率 低下 是 因为 发 送 方 在 发 出 一 个 数据 后 就 必须 停 下 来 等 
待 对 方 的 确认 ， 也 就 是 说 在 这 段 时 间 里 从 发 送 到 接收 方 的 路 径 上 只 有 一 个 数据 在 传输 ， 即 只 
有 一 个 设备 是 忙 的 ， 其 他 设备 都 是 空闲 的 。 滑 动 窗口 机 制 的 改进 在 于 它 让 发 送 方 可 以 连续 发 
送 多 个 数据 ， 然 后 等 待 接收 方 的 确认 。 这 样 就 大 大 提高 了 网 络 的 利用 率 。 现 在 开始 具体 解释 
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滑动 窗口 机 制 的 工作 原理 。 


可 以 将 TCP 协议 发 送 的 字 节 流 根据 状态 分 为 三 个 部 分 :第 一 部 分 是 已 经 发 送 过 且 收 到 了 


对 方 确认 的 ，TCP 能 确定 这 些 数据 已 被 对 方 收 到 。 


第 二 部 分 为 已 经 发 送 但 还 没有 收 到 对 方 确 


认 的 ， 这 些 数据 可 能 正在 传输 途中 ， 也 可 能 对 方 已 经 收 到 但 正在 传输 这 些 数据 的 确认 ， 还 有 
可 能 数据 确认 已 经 丢失 了 。 第 三 部 分 的 数据 就 是 TCP 还 没有 发 送 的 数据 。 图 9.9 就 表示 了 这 


种 划分 关系 。 


己 发 送 | Ae 


待 发 送 


图 9.9 TCP 数据 状态 划分 


对 于 已 发 送 的 数据 ，TCP 协议 可 以 完全 不 用 关心 ， 也 不 用 保存 。 对 于 待 发 送 的 数据 ， 可 
能 应 用 程序 还 没有 提交 给 TCP 协议 , 也 有 可 能 以 字 节 流 的 形式 保存 在 TCP 协议 的 缓冲 区 中 。 
而 对 于 发 送 中 的 数据 , TCP 协议 已 经 构造 好 了 数据 段 , 而且 TCP 协议 必须 为 这 些 数据 段 启 动 
一 个 定时 器 。 在 定时 器 超时 后 如 果 没 有 收 到 确认 就 必须 将 数据 段 进行 重 发 。 发 送 中 的 数据 可 


以 是 多 个 数据 段 ,但 必须 是 有 限 的 ， 要 根据 连接 
双方 的 资源 量 而 定 。 初 始 情况 下 已 发 送 部 分 的 长 
度 是 0， 当 不 断 发 送 数据 并 不 断 收 到 确认 时 ， 图 
中 的 灰色 区 就 不 断 地 向 右 移动 ， 直 到 所 有 数据 发 
送 完毕 。 这 个 灰色 区 域 就 好 像 是 整个 数据 中 的 一 
个 窗口 ， 且 该 窗口 是 不 断 移动 的 ， 所 以 称 为 移动 
窗口 机 制 。 

移动 窗口 机 制 中 窗口 的 大 小 决定 了 数据 传 
输 的 效率 。 在 极端 的 情况 下 窗口 的 大 小 为 1， 那 
就 是 前 面 讲 过 的 简单 确认 重 发 机 制 。 如 果 窗 口 的 
大 小 合适 ， 就 可 以 最 大 限度 地 利用 整个 网 络 资 
源 。 图 9.10 就 说 明了 这 个 原理 。 

我 们 假设 图 中 是 一 种 理想 状态 ， 即 数据 发 送 
有 延 时 但 不 丢失 。 这 样 可 以 简化 要 说 明 的 问题 但 
不 会 影响 它 的 本 质 。 实 线 表 示 发 送 的 数据 ， 虚 线 
表示 对 接收 到 的 数据 的 确认 。 实 线 之 间 的 间隔 表 


图 9.10 ”移动 窗口 机 制 对 网 络 资源 的 利用 率 


示 发 送 方 准备 数据 需要 的 时 间 。 那 么 在 图 中 发 送 方 把 窗口 的 大 小 设 为 4 就 可 以 最 佳 地 利用 网 
络 资源 了 。 首 先 ， 发 送 方 可 以 一 次 发 送 4 个 数据 而 不 用 等 待 对 方 的 确认 。 它 刚 发 送 完 第 4 个 
数据 就 收 到 了 第 1 个 数据 的 确认 ， 这 样 它 就 可 以 将 窗口 向 右 移动 一 个 位 置 ， 这 时 就 可 以 发 送 
第 5 个 数据 了 。 依 此 类 推 。 从 图 中 可 以 看 出 ， 这 种 机 制 极 大 地 利用 了 TCP 这 种 全 双 工 连接 的 
特点 同时 进行 双向 传输 。 图 9.11 就 说 明了 图 9.10 中 发 送 窗口 的 移动 情况 。 


初始 窗口 


收 到 第 一 个 确认 后 


图 9.11 窗口 移动 过 程 
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9422 TCP 数据 段 的 标识 一 序列 号 


因为 数据 段 在 使 用 他 数据 包 进 行 传输 时 有 可 能 会 丢失 、 失 序 或 重复 。 所 以 发 送 方 和 接收 
方 都 要 有 一 种 机 制 来 区 分 收 到 的 数据 段 或 确认 是 否 是 同一 个 , 并 区 分 数据 段 的 先后 关系 。TCP 
数据 段 头 部 有 一 个 序列 号 字段 ， 该 字段 就 是 用 来 标识 不 同 的 数据 段 的 。 后 面 的 数据 段 序 列 号 
大 于 前 面 数据 段 的 序列 号 。 但 TCP 协议 中 的 序列 号 不 是 数据 段 的 编号 ， 而 是 按 字 节 进 行 编号 
的 。 例 如 前 一 个 数据 段 的 序列 号 是 216 且 该 数据 段 的 数据 区 携带 了 100B， 那 么 后 一 个 数据 
段 的 序列 号 应 该 是 316。 

另外 ，TCP 数据 段 头 部 还 有 一 个 确认 号 字段 ， 该 字段 作用 是 用 来 向 数据 发 送 方 确认 它 已 
经 收 到 的 数据 段 。TCP 协议 之 所 以 需要 序列 号 和 确认 号 两 个 字段 是 因为 它 允 许 连接 的 两 方 在 
发 送 数 据 时 对 对 方 的 数据 段 进行 确认 , 而 不 是 使 用 单独 的 确认 段 进行 确认 。 因 为 TCP 是 全 双 
工 的 连接 ， 连 接 的 两 端 可 以 同时 向 对 方 发 送 数据 。 因 此 这 种 确认 方式 减少 了 数据 段 的 数量 ， 
提高 了 数据 传输 的 效率 。 需 要 指出 的 是 ，TCP 对 数据 段 的 确认 号 不 是 简单 的 确认 收 到 的 数据 
段 的 序列 号 ,而 是 表示 它 准备 接收 的 下 一 个 数据 段 的 序列 号 。 例 如 TCP 收 到 一 个 数据 段 的 序 
列 号 是 216 且 该 数据 段 的 数据 区 携带 了 100B， 那 么 它 发 送 的 数据 段 中 应 该 将 确认 号 设置 为 
316， 表 示 它 希望 接收 序列 号 为 316 以 前 的 数据 都 已 经 收 到 了 。 还 需要 指出 的 是 ， 确 认 号 字 
段 不 是 在 每 个 数据 段 中 都 用 到 的 ， 只 有 数据 段 中 设置 了 ACK 位 才 表示 确认 号 字段 有 意义 。 

虽然 字 节 流 的 第 一 个 字 节 的 编号 总 应 该 是 1, 但 TCP 中 携带 字 节 流 中 第 一 个 字 节 的 数据 
段 的 序列 号 并 不 总 是 1, 这 是 因为 TCP 协议 规定 每 个 TCP 连接 的 初始 序列 号 必须 是 随机 产生 
的 一 个 值 ， 这 个 值 是 在 建立 连接 的 过 程 中 指定 的 。 我 们 回顾 一 下 TCP 连接 的 建立 过 程 。 当 时 
没有 提 及 序列 号 的 问题 ， 现 在 重新 来 解释 这 个 问题 。 

连接 发 起 方 的 一 端的 数据 段 中 必须 将 SYN 位 置 1, 同时 它 还 需要 产生 一 个 随机 的 初始 序 
列 号 并 将 数据 段 的 序列 号 字段 的 值 置 为 该 值 。 被 动 打 开 方 在 发 送 SYNACK 之 前 也 必须 产生 
一 个 自己 的 随机 初始 序列 号 。 整 个 连接 建立 的 完整 过 程 如 图 9.12 所 示 。 


主动 打开 方 被 动 打 开 方 


发 送 SYN(seq=x, dlen-m) 


接收 SYN 


发 送 SYN (seq=y)+ACK(aseq=x+m+1) 
(dlen=n) 


接收 
SYN+ACK 
发 送 ACK(aseq=ytn+l 


接收 ACK 


图 9.12 TCP 连接 过 程 中 初始 序列 号 的 确定 
9.12 F, seq 表示 序列 号 字段 ，aseq 表示 确认 号 字段 ，dlen 不 代表 任何 字段 ， 而 是 指 
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数据 区 的 长 度 。 虽 然 通常 建立 连接 的 数据 段 中 都 不 携带 数据 ， 但 并 不 是 不 可 以 携带 。 
9423 TCP 的 滑动 窗口 机 制 

前 面 是 以 数据 包 为 单位 说 明基 本 滑动 窗口 机 制 的 工作 原理 。 在 TCP 协议 的 滑动 窗口 机 制 
中 ， 基 本 的 数据 单位 不 是 数据 段 ， 而 是 字 节 。 在 TCP 协议 中 ， 每 个 窗口 都 用 3 个 指针 表示 ， 
如 图 9.13 所 示 。 


[rJ 


14 15 16 17 18 19 20 21|22 .. 


1 + + 


图 9.13 TCP 窗口 的 3 个 指针 


第 一 个 指向 窗口 的 第 一 个 字 节 ， 第 二 个 指向 窗口 中 马上 要 发 送 的 字 节 ， 第 三 个 指向 窗口 
的 最 后 一 个 字 节 。 除 了 发 送 方 需要 一 个 窗口 外 ， 接 收 方 也 要 有 一 个 窗口 表示 当前 需要 接收 的 
数据 ， 但 接收 方 的 窗口 无 法 用 3 个 指针 表示 ， 原 因 如 图 9.14 所 示 。 


. 200 | 201 500 | 501 732 | 733 800 | 801 1000| 1001 … 


图 9.14 TCP 数据 接收 方 窗口 状态 


图 中 每 个 实 线 框 表示 接收 方 的 当前 窗口 ， 灰 色 部 分 表示 已 收 到 的 数据 。 因 为 数据 段 的 失 
序 使 得 接收 方 无 法 将 这 些 数据 还 原 为 字 节 流 ， 所 以 它 必 须 先 暂 存 这 些 数据 。 但 接收 方 也 无 法 
就 已 收 到 的 部 分 数据 向 发 送 方 发 出 确认 , 因为 TCP 数据 段 的 确认 号 字段 表示 的 是 接收 方 希望 
接收 的 数据 的 编号 ， 即 该 编号 之 前 的 数据 都 已 接收 到 了 。 如 果 下 一 次 一 个 序列 号 为 201， 数 
据 区 长 度 为 300 的 数据 段 到 达 ， 则 接收 方 可 以 将 下 一 个 发 送 的 数据 段 的 ACK 位 置 1 并 将 确 
认 号 字段 设 为 733 了 。 这 样 接收 方 和 发 送 方 的 窗口 就 可 以 向 右 移动 到 733 位 置 了 。 

因为 TCP 连接 是 全 双 工 的 , 所 以 连接 的 每 一 端 都 必须 保存 两 个 窗口 ,一 个 用 于 发 送 数 据 ， 
一 个 用 于 接收 数据 。 

TCP 的 这 种 确认 方式 称 为 累积 确认 。 这 种 确认 方式 有 它 的 优点 和 缺点 。 

先 看 累积 确认 的 优点 。 首 先 ， 它 允许 发 送 方 在 对 数据 进行 重 发 时 发 送 更 多 的 数据 。 举 例 
说 明 这 个 问题 。 例如 发 送 方 的 应 用 程序 先 递 交 了 500B 的 数据 给 TCP 传输 ,等 TCP 将 该 数据 
发 出 后 应 用 程序 又 递交 了 300B。 这 时 如 果 TCP 没有 收 到 签名 500B 的 数据 的 确认 ， 它 就 可 
以 将 800B 数据 一 次 发 送出 去 。 这 就 增加 了 前 面 500B 数据 传输 成 功 的 几率 。 其 次 ， 累 积 确认 
无 需 对 丢失 的 确认 进行 重 发 。 因 为 确认 数据 段 也 会 丢失 ， 但 只 要 下 一 个 确认 能 够 到 达 对 方 就 
无 需 对 前 一 个 确认 进行 重 发 。 

为 了 说 明 累 积 确认 的 缺点 ， 考 虑 图 9.15 所 示 的 情况 。 


-200 | 201 500 | S01 732 | 733 800 |801 1000| 1001 .. 
图 9.15 累积 确认 极端 情况 
9.15 是 接收 方 的 窗口 ， 每 个 方 框 表示 一 个 数据 段 。 窗 口 的 大 小 位 800B， 发 送 方 为 4 


个 数据 段 将 一 个 窗口 内 的 数据 发 送 给 接收 方 。 在 传输 途中 ， 第 一 个 数据 段 丢 失 。 发 送 方 发 送 
了 数据 后 就 启动 一 个 计时 器 ， 等 待 对 方 确认 。 但 由 于 接收 方 没有 收 到 第 一 个 数据 段 ， 所 以 它 
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发 送 的 每 个 数据 段 的 确认 号 都 为 201。 发 送 方 超时 后 就 要 重 发 数据 ， 但 它 是 应 该 重 发 所 有 数 
据 呢 ? 还 是 应 该 只 发 送 第 一 个 数据 段 的 数据 ? 如 果 它 重 发 所 有 的 数据 ， 那 后 面 3 个 都 是 多 余 
的 。 将 它们 进行 重 发 不 但 浪费 两 方 的 计算 资源 ， 还 会 浪费 网 络 带宽 。 虽 然 目前 的 标准 做 法 是 
重 发 第 一 个 数据 段 。 但 这 也 有 一 个 问题 , 如 果 接 收 方 确实 一 个 数据 段 都 没有 接收 到 , 那么 TCP 
现在 的 机 制 就 回 到 了 最 原始 的 简单 确认 重 发 机 制 ，TCP 每 次 只 能 发 送 一 个 数据 段 。 标 准 做 法 
之 所 以 只 发 送 一 个 数据 包 主 要 是 为 了 保护 整个 网 络 , 因为 所 有 TCP 连接 都 重 发 所 有 数据 包 会 
极 大 地 增加 网 络 的 负担 ， 甚 至 造成 网 络 衣 溃 。 

现在 看 TCP 协议 中 窗口 的 大 小 。 显然 ,窗口 是 越 大 越 好 ， 数 据 传输 的 效率 会 越 高 。 但 从 
TCP 的 移动 窗口 机 制 可 以 看 到 维护 一 个 窗口 是 需要 资源 的 ,至少 需 要 和 窗口 大 小 相同 的 缓冲 
区 。 对 于 一 些 内 存 资源 紧张 的 系统 〈 如 嵌入 式 设 备 ) 来 说 ， 其 窗口 不 可 能 设置 得 很 大 。 由 于 
发 送 方 会 将 其 当前 窗口 内 的 数据 一 次 性 的 发 送出 去 ， 这 就 要 求 发 送 方 的 窗口 不 能 大 于 接收 方 
的 端口 ， 否 则 接收 方 可 能 无 法 容纳 超过 其 窗口 大 小 的 数据 。 虽 然 接收 方 可 以 选择 丢弃 窗口 之 
外 的 数据 ， 不 至 于 造成 系统 崩溃 ， 但 这 就 意味 着 该 数据 的 发 送 是 一 种 资源 的 浪费 ， 根 本 不 应 
该 发 送 。 所 以 ， 发 送 方 应 该 根据 接收 方 窗口 的 大 小 来 设置 自己 的 窗口 大 小 ， 使 其 不 大 于 对 方 
的 窗口 。 这 就 需要 有 一 种 机 制 来 让 接收 方 将 自己 的 窗口 大 小 通知 给 发 送 方 ， 这 是 通过 使 用 
TCP 数据 段 头 部 的 窗口 字段 来 完成 的 。 在 TCP 协议 中 ， 凡 是 ACK 置 为 1 的 数据 段 都 应 该 将 
自己 接收 窗口 的 当前 大 小 填 入 窗口 字段 中 。 这 样 做 就 允许 接收 方 随时 改变 窗口 的 大 小 。 但 有 
一 点 需要 说 明 的 是 ， 新 窗口 的 右边 界 不 能 小 于 原 窗 口 的 右边 界 。 例 如 接收 方 当前 的 窗口 为 
101 一 1000， 那 么 在 它 下 次 收 到 一 个 序列 号 为 101 数据 区 长 度 为 100 的 数据 段 之 后 ， 它 可 以 
在 确认 数据 段 中 将 窗口 大 小 设 为 800， 但 不 能 设 为 799。 虽 然 缩 小 窗口 大 小 有 限制 ， 但 接收 
方 可 以 随时 扩大 窗口 的 大 小 。 还 是 上 例 ， 即 使 接收 方 没 有 收 到 任何 数据 段 ， 它 也 可 以 在 确认 
数据 段 中 将 窗口 大 小 改 为 1000。 缩 小 窗口 的 最 极端 的 例子 就 是 将 窗口 的 大 小 设 为 0， 这样 就 
停止 了 数据 传输 。 

那么 接收 方 为 什么 需要 一 个 可 变 大 小 的 窗口 呢 ? 这 不 但 和 接收 方 的 存储 能 力 有 关 ， 还 要 
受到 接收 方 的 计算 能 力 的 限制 。 为 说 明 这 个 问题 ， 看 图 9.16 所 示 的 例子 。 


.. 200 201 1000 1001 ... 


.. 500 501 1000 1001 ... 


.. 800 801 1000| 1001 … 


.. 800 801 1600 1601 ... 


9.16 TCP 接收 窗口 大 小 变化 示例 


图 9.16 中 ， 接 收 窗口 的 初始 大 小 为 800B。 图 中 最 上 面 的 图 表示 TCP 协议 在 等 待 数据 。 
第 二 个 图 表示 收 到 了 201 一 500 的 数据 ， 所 以 窗口 的 左边 界 向 右 滑动 到 501. 但 上 层 应 用 程序 
由 于 某 种 原因 (如 数据 发 送 过 快 ， 来 不 及 处 理 或 某 部 分 需要 人 工 干预 ， 正 在 等 待 等 ) 无 法 接 
收 数据 ， 导 致 缓冲 区 中 的 数据 无 法 提交 。 这 无 形 中 就 减 小 了 缓冲 区 的 大 小 ， 使 得 窗口 的 右边 
界 无 法 向 右 移动 。 接 收 方 通过 在 ACK 数据 段 中 将 窗口 大 小 改 为 500 通知 发 送 方 ， 发 送 方 就 
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相应 地 减 小 《如 果 需 要 ) 发 送 窗口 的 大 小 。 如 果 下 次 收 到 数据 还 无 法 提交 给 上 层 应 用 程序 ， 
窗口 将 继续 减 小 。 一 旦 应 用 程序 处 理 完 数据 ，TCP 协议 可 以 将 积压 的 所 有 数据 提交 上 去 ， 窗 
口 就 可 以 恢复 原来 的 大 小 了 。 

综 上 所 述 ，TCP 协议 使 用 的 是 以 累积 确认 为 基础 ， 字 节 为 单位 的 可 变 大 小 的 滑动 窗口 机 
制 。 这 种 机 制 不 但 实现 了 数据 的 可 靠 、 高 效 的 传输 ， 还 实现 了 端 到 端的 流量 控制 。 


9.4.3 ”超时 的 判断 


TCP 协议 使 用 的 可 变 大 小 的 滑动 窗口 机 制 实现 了 可 靠 的 高 效 传输 和 流量 控制 , 但 这 种 机 
制 还 是 以 确认 重 发 为 基础 的 。 确 认 重 发 机 制 要 求 发 送 方 在 数据 发 出 后 启动 一 个 计时 器 ， 在 计 
时 器 超时 后 就 假设 数据 丢失 并 进行 数据 的 重 发 。 在 本 节 中 将 介绍 TCP 协议 的 超时 判断 机 制 。 
超时 判断 机 制 对 于 TCP 协议 至 关 重 要 ， 因 为 它 直接 影响 到 TCP 协议 的 效率 。 


9.4.3.1 TCP 协议 判断 超时 的 难度 


判断 超时 最 简单 的 办 法 就 是 指定 一 个 固定 的 超时 值 ， 启 动 一 个 时 间 间 隔 为 该 值 的 定时 
器 ， 定 时 器 超时 后 就 进行 重 发 。 这 个 固定 值 的 指定 可 以 有 两 种 选择 : 第 一 种 可 以 选择 一 个 最 
大 的 值 ， 所 有 网 络 的 数据 传输 加 上 确认 传输 的 时 间 ， 即 数据 传输 一 个 来 回 的 时 间 (也 称 为 
RTT, Round Trip Time〉， 都 不 超过 该 时 间 。 这 样 在 该 时 间 过 后 就 可 以 确定 数据 确实 已 经 丢 
失 了 。 但 这 种 机 制 是 很 低 效 的 ， 因 为 可 能 大 多 数 网 络 的 传输 时 间 远 远 低 于 这 个 值 ， 多 等 待 的 
时 间 是 浪费 ,降低 了 传输 的 效率 。 第 二 种 是 选择 一 个 较 小 的 值 ， 这样 好 像 可 以 提高 传输 效率 ， 
但 实际 上 并 不 会 。 虽 然 丢失 的 数据 不 需要 等 待 多 久 就 进行 重 发， 但 因此 也 造成 了 很 多 稍 有 延 
迟 的 数据 包 的 重 发 。 这 样 就 使 得 发 送 方 和 接收 方 必须 处 理 很 多 重复 的 数据 ， 更 严重 的 是 造成 
了 网 络 上 有 过 多 的 重复 数据 包 在 传输 。 所 有 的 主机 都 这 样 做 就 会 增加 网 络 负担 ， 并 降低 网 络 
传输 效率 甚至 造成 网 络 瘫痪 。 显 然 TCP 协议 不 能 使 用 这 种 方法 。 

首先 来 看 看 TCP 协议 的 目标 。TCP 协议 提供 的 是 可 靠 的 服务 ， 但 这 种 服务 首先 应 该 是 
高 效 的 , 否则 就 没有 应 用 程序 会 使 用 了 。 因 此 TCP 协议 应 该 尽量 不 重 发 已 经 传输 成 功 的 数据 ， 
而 对 于 已 经 丢失 的 数据 应 该 尽量 早 地 重 发 。 要 达到 该 目的 的 前 提 是 准确 地 估计 网 络 的 RTT. 
但 TCP 要 估计 网 络 的 RTT 是 一 件 很 困难 的 事情 ， 这 是 由 Internet 的 复杂 性 决定 的 。 

首先 ， 在 Internet 中 ， 一 个 数据 包 的 发 送 可 能 是 两 个 主机 之 间 直 接 进行 的 ， 也 有 可 能 要 
经 过 很 多 的 网 络 节点 (交换 机 、 路 由 器 等 ) 。 不 同 的 网 络 环境 传输 数据 所 需要 的 时 间 也 是 不 
同 的 ， 那 么 RTT 也 会 不 同 。 而 且 各 种 网 络 RTT 间 的 差别 是 很 大 的 。 其 次 ， 即 使 是 一 个 网 络 
之 中 ， 数 据 的 传输 效率 也 会 根据 网 络 数据 流量 的 情况 发 生变 化 。 这 在 跨 网 络 的 通信 中 尤其 
明显 。 

对 RTT 的 估计 是 判断 超时 的 关键 ， 虽 然 要 估计 网 络 的 RITT 是 很 困难 的 ，TCP 协议 还 是 
有 一 套 很 灵活 的 机 制 来 合理 的 估计 RTT. 
9432 RIT 的 计算 

首先 ，TCP 协议 RTT 的 计算 是 面向 连接 的 ， 即 它 为 不 同 的 连接 分 别 计算 RTT。 这 是 因 


为 连接 是 由 两 个 端点 决定 的 ， 有 的 连接 可 能 是 一 个 物理 网 络 中 的 两 台 主 机 甚至 是 一 台 主 机 内 
部 ， 而 有 的 连接 可 能 需要 跨越 多 个 网 络 。 它 们 的 RIT 显然 是 不 同 的 。 
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TCP 采用 取样 统计 的 方式 计算 连接 的 RTT. TCP 协议 记录 每 个 数据 段 发 送 的 时 间 , 在 收 
到 对 该 数据 段 中 数据 的 确认 后 , 计算 两 者 之 间 的 时 间 差 , 即 新 的 RIT 样 本。 然后 使 用 下 面 的 
公式 计算 新 的 RIT: 

RTT = CaxIHÉf RTT) +[ (1—a) x 新 的 RIT HEA] 

AF, a 是 一 个 大 于 0 小 于 1 的 数 。 从 公式 中 可 以 看 出 ，a WA, HH RTT 样本 对 RIT 的 影 
响 越 小 ，RTT 的 值 就 越 稳定 ，a 越 小 ， 新 的 RTT 样本 对 RTT 的 影响 就 越 大 ，RTT 的 值 就 越 
不 稳定 。 通 常 a 都 设置 为 0.9。 

在 发 送 数 据 段 后 启动 该 数据 段 的 定时 器 ，TCP 协议 要 根据 当前 的 RTT 计算 该 定时 器 的 
超时 值 ， 计 算 公 式 如 下 : 

Timeout = bxRTT 

5 是 一 个 大 于 1 的 数 ， 对 b 的 值 也 有 一 个 选择 问题 。 如 果 5b 选择 过 大 ， 对 于 已 经 丢失 的 数据 
就 要 等 很 久 才 会 进行 重 发 ， 如 果 将 b 设 为 1， 就 显得 太 急 了 。 数 据 传 输 稍微 有 点 延迟 就 进行 
重 发 。 标 准 建议 将 b 的 值 设 为 2。 
943.3 Kam 算法 
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时 判断 的 机 制 现 在 还 是 刚 开 始 。 

判断 RTT 的 原理 很 简单 ， 就 是 不 停 地 取样 然后 与 原 有 的 RTT 一 起 计算 新 的 RTT。 但 应 
该 清楚 TCP 在 超时 后 会 对 数据 进行 重 发 。 现 在 就 假设 一 个 TCP 连接 中 一 方 发 送 了 一 个 数据 
段 之 后 启动 定时 器 ， 并 在 定时 器 超时 后 重 发 了 该 数据 段 。 过 了 一 段 时 间 收 到 了 对 该 数据 段 中 
数据 的 确认 。 现 在 出 现 一 个 问题 ，TCP 在 收 到 该 确认 段 之 后 ， 应 该 把 它 作为 最 初 发送 的 数据 
段 的 确认 还 是 应 该 把 它 作为 重 发 的 数据 段 的 确认 呢 ? 答案 是 选择 任何 一 个 都 是 错误 的 。 

首先 , 如果 将 该 确认 作为 最 初 发 送 的 数据 段 的 确认 , 那么 取出 的 RTT 样本 肯定 大 于 现在 
的 RIT。 这 样 算出 来 的 新 的 RTT 也 就 大 于 现在 的 RTT To WR TCP 连接 是 跨 多 个 网 络 的 
数据 的 丢失 率 可 能 会 很 高 。 这 就 会 造成 连接 的 RTT 会 不 断 上 升 。 在 极端 的 情况 下 ， 如 果 每 个 
数据 段 都 至 少 丢 失 一 次 的 话 ，RTT 会 变 得 无 穷 大 。 因 为 每 丢失 一 个 数据 段 并 在 重 发 后 收 到 确 
认 时 所 取得 的 RTT 样本 都 会 大 于 当前 的 RTT 值 ， 所 以 会 造成 RTT 值 的 不 断 上 升 。 

那么 , 选择 将 重 发 后 收 到 的 确认 作为 重 发 数据 段 的 确认 呢 ? 我 们 考虑 在 网 络 传输 延 时 突 
然 增 大 的 情况 下 会 发 生 什 么 ? 这 时 发 送 的 数据 并 没有 真正 丢失 ， 接 收 方 在 接 到 数据 后 就 发 出 
确认 。 但 在 该 确认 到 达 数 据 的 发 送 方 之 前 发 送 方 的 定时 器 就 超时 了 。 这 时 发 送 方 会 重 发 数据 ， 
但 过 不 了 多 久 就 收 到 了 确认 。TCP 会 将 它 当 作 重 发 数据 段 的 确认 。 这 时 取得 的 RTT 样本 反 
而 会 比较 小 ， 小 于 已 有 的 RTT。 新 的 RTT 反而 会 小 于 现 有 的 RTT， 那 么 后 面 发送 的 数据 段 
就 更 容易 超时 了 。 试 验 表明 ， 在 稳定 状态 下 ， 将 重 发 后 收 到 的 确认 作为 重 发 数据 段 的 确认 最 
终 会 使 得 计算 得 到 的 RIT 是 实际 RTT 的 一 半 ， 并 造成 每 个 数据 段 都 重 发 一 次 。 

既然 上 述 两 种 选择 都 不 正确 ， 那 TCP 协议 该 如 何 处 理 ? 答案 很 简单 :这 种 情况 下 TCP 
就 不 应 该 进行 RTT 取样 并 重新 计算 RTT。 这 个 思想 称 为 Kam 算法 ， 因 为 它 是 Kam 提出 来 
Hj. 单纯 的 忽略 这 种 情况 也 是 不 行 的， 因为 超时 的 发 生 确实 说 明了 网 络 状况 的 变 差 ，TCP 应 
该 要 作出 相应 的 反应 。 例 如 在 上 面 提 到 的 网 络 传输 延 时 突然 增 大 时 ， 每 个 数据 包 都 有 可 能 会 
超时 。 如 果 单 纯 地 忽略 超时 重 发 后 的 确认 ， 不 对 超时 值 加 以 变化 也 同样 会 造成 每 个 数据 段 都 
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要 重 发 一 次 。 为 了 反映 超时 重 发 时 网 络 状况 的 变化 , Kam 算法 要 求 每 次 发 生 超时 重 发 时 TCP 
都 应 该 增加 连接 的 超时 值 。 通 常 的 做 法 都 是 将 超时 值 增加 一 倍 。 但 为 了 防止 超时 值 无 ”限度 
地 增加 , 大 多 TCP 实现 都 规定 一 个 超时 值 的 上 限 , 该 值 大 于 Internet 上 数据 传输 的 最 大 延 时 。 

Karn 算法 的 思想 是 将 RTT 的 计算 和 超时 值 的 计算 分 开 。 先 基于 RTT 计算 一 个 初始 的 超 
时 值 ， 然 后 每 次 发 生 超时 重 传 就 将 增加 超时 值 。 直 到 下 一 个 数据 段 不 需要 重 传 就 收 到 确认 时 
再 对 RTT 取样 ， 更 新 RTT 的 值 ， 并 重新 基于 RTT 计算 超时 值 。 


9.4.3.4 超时 值 的 适应 范 国 


网 络 环境 是 动态 的 ， 会 随时 间 变 化 的 。 尤 其 网 络 传输 延 时 每 时 每 刻 都 是 不 同 的 ， 它 会 随 
着 网 络 负载 的 变化 而 变化 。 排 队 论 的 理论 证 明 ，RTT 的 变化 范围 > 会 根据 网 络 负载 的 不 同 按 
公式 11(1 7 DARE, 这 里 工 是 一 个 不 小 于 0 且 不 大 于 1 的 数 。 上 面 这 句 话 的 意思 是 : 网 络 的 
负载 越 重 ， 它 传输 数据 产生 的 延迟 的 范围 就 越 大 。 例 如 ， 如 果 网 络 负载 为 30%， 那 么 网 络 传 
输 延 时 的 变化 范围 就 是 土 2+， 或 者 4。 上 面 描述 的 计算 方法 是 在 最 初 的 TCP 协议 中 指定 的 ， 
在 公式 Timeout = bxRTT 中 , 如果 将 b 设 为 2 时 估算 的 RTT 值 只 能 适应 网 络 负载 为 30% 时 的 
RTT 变化 。 
1989 年 的 TCP 规范 要 求 TCP 实现 不 但 要 估算 RTT 值 , 还 要 估算 它 的 方差 , 并 使 用 方差 
来 代替 公式 中 的 常量 b 来 计算 超时 值 。 这 样 能 使 得 TCP 适应 的 网 络 延 时 范围 更 广 , 吞吐 量 更 
高 。 而 且 方差 的 计算 也 非常 简单 : 
DIFF = RTT 样本 - 现在 的 RIT 
新 RIT= 现在 的 RIT + g x DIFF 
新 DEV = 现在 的 DEV + px ([DIFF| - 现在 的 DEV) 
Timeout = 3 RTT - gx 新 DEV 
上 面 的 几 个 公式 中 ，DEYV 是 估算 出 来 的 平均 偏差 ，g 是 一 个 用 来 控制 新 的 样本 对 RTT 值 的 
影响 程度 的 0 到 1 的 因子 , p 是 一 个 用 来 控制 新 样本 对 平均 偏差 的 影响 程度 的 0 到 1 的 因子 ， 
q 则 是 用 来 控制 平均 偏差 对 超时 值 的 影响 程度 的 因子 。 通 常 将 这 几 个 因子 设 为 : g= 8, p= 
1/4, q=3。 


9.4.4 TCP 的 拥塞 控制 机 制 


所 谓 拥塞 就 是 指 网 络 中 的 转发 设备 (如 路 由 器 因为 过 多 的 数据 包 到 达 需 要 转发 而 造成 
某 些 数据 包 的 转发 延 时 过 大 或 丢失 。 发 生 拥 塞 时 ， 路 由 器 会 将 到 达 的 数据 包 放 在 等 待 转发 的 
队列 中 。 需 要 转发 的 数据 包 越 多 ， 队 列 就 越 长 ， 拥 塞 就 越 严重 ， 数 据 包 转发 的 延 时 就 越 长 。 
一 旦 路 由 器 的 存储 资源 都 被 队列 占 满 ， 那 后 面 到 达 的 数据 包 就 会 被 丢弃 。 路 由 器 在 丢弃 数据 
包 时 ， 会 向 数据 包 的 源 主机 发 送 类 型 为 源 端 关闭 的 ICMP 数据 包 ， 但 这 并 不 会 解决 问题 。 因 
为 拥塞 造成 数据 包 传 输 的 延 时 增 大 甚至 丢失 ， 通 常 协议 对 此 的 反应 就 是 重 发 数据 包 ， 而 这 无 
疑 就 更 加 重 了 网 络 拥塞 的 程度 。 拥 塞 程度 越 严重 ， 延 时 就 越 长 。 这 又 会 导致 再 一 次 的 数据 重 
发 ， 直 到 网 络 瘫痪 。 因 此 必须 在 发 送 端的 上 层 协 议 探测 网 络 拥塞 状况 并 对 此 作出 反应 。 

在 TCP 的 滑动 窗口 机 制 中 说 明了 该 机 制 能 实现 端 到 端的 流量 控制 , 使 发 送 端的 发 送 速度 
能 适应 接收 端的 接收 能 力 。TCP 滑动 窗口 机 制 的 另 一 个 作用 就 是 减轻 或 避免 网 络 拥塞 。 

要 避免 或 减轻 网 络 拥塞 ，TCP 协议 必须 在 网 络 发 生 拥塞 时 放 慢 数据 段 的 发 送 速度 。 但 在 
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控制 算法 上 必须 仔细 设计 ， 因 为 通常 情况 下 网 络 的 RTT 也 会 有 波动 。TCP 不 能 为 了 避免 拥 
塞 而 对 数据 传输 的 效率 产生 大 的 影响 。TCP 用 来 避免 拥塞 的 机 制 称 为 慢 启动 和 成 倍 减少 。 这 
两 项 机 制 是 相辅相成 的 。 

前 面 提 到 ， 发 送 方 必须 根据 接收 方 在 确认 段 中 设置 的 窗口 字段 设置 发 送 窗口 的 大 小 。 为 
了 避免 拥塞 ，TCP 的 发 送 窗口 的 大 小 还 受到 另外 一 个 因素 的 限制 ， 这 个 限制 称 为 拥塞 窗口 。 
TCP 协议 实际 发 送 窗口 的 大 小 应 该 是 拥塞 窗口 和 接收 方 接收 窗口 中 小 的 一 个 。 

我 们 先 看 成 倍 减少 机 制 。 在 稳定 状态 下 ， 没 有 拥塞 发 生 ， 这 时 拥塞 窗口 的 大 小 和 接受 方 
接收 窗口 的 大 小 是 一 样 的 。 如 果 发 生 了 拥塞 ，TCP 可 以 通过 减 小 拥塞 窗口 的 大 小 来 减少 发 送 
到 网 络 的 数据 包 的 数量 。TCP 对 拥塞 窗口 的 操作 为 : 当 TCP 发 现 数据 段 丢失 即 超时 重 发 
时 ， 就 将 拥塞 窗口 的 大 小 减少 一 半 《 但 其 大 小 至 少 应 为 1 ) 。 对 于 减 小 窗口 后 仍 在 发 送 窗口 
中 的 数据 段 ， 将 其 重 发 的 超时 值 延长 一 倍 。 因 此 ， 如 果 数 据 段 不 断 丢失 ，TCP 的 发 送 窗口 的 
大 小 会 呈 指 数 级 减 小 , 即 发 出 的 数据 包 会 呈 指数 级 减少 , 且 重 发 的 时 间 间 隔 会 呈 指数 级 增加 。 
如 果 一 直 发 生 丢失 ， 最 终 TCP 发 送 的 数据 段 就 会 减少 到 1， 且 发 送 间隔 会 不 断 增加 。 这 样 显 
然 有 助 于 路 由 器 从 拥塞 状态 中 恢复 过 来 。 

那么 在 路 由 器 从 拥塞 状态 恢复 之 后 ，TCP 如 何 恢复 其 正常 的 数据 发 送 呢 ? 这 就 需要 依靠 
慢 启 动机 制 了 。 需 要 指出 的 是 ， 在 网 络 畅通 之 后 ，TCP 不 能 马上 将 拥塞 窗口 恢复 到 接受 方 窗 
口 的 同样 大 小 ， 因 为 这 样 做 又 会 使 网 络 陷入 拥塞 之 中 。 如 此 反复 ， 网 络 会 在 空闲 和 拥塞 之 间 
BA. TCP 的 慢 启 动机 制 是 这 样 的 : 在 TCP 启动 一 个 新 的 连接 或 拥塞 结束 后 , 将 拥塞 窗口 的 
大 小 设置 为 一 个 数据 段 的 大 小 。 然 后 每 收 到 一 个 确认 段 ，TCP 就 将 拥塞 窗口 的 大 小 增加 一 个 
数据 段 。 慢 启动 机 制 能 够 避免 在 拥塞 恢复 或 建立 新 的 连接 后 向 网 络 中 发 送 的 数据 过 快 过 多 。 
虽然 该 机 制 称 为 慢 启动 机 制 , 但 如 果 网 络 通畅 该 机 制 并 不 会 慢 。 因 为 在 TCP 收 到 第 一 个 确认 
段 后 就 可 以 发 送 两 个 数据 段 了 , 再 过 一 个 RTT 之 后 就 会 收 到 两 个 确认 段 从 而 可 以 发 送 四 个 数 
据 段 了 。 因 此 在 网 络 通 畅 的 情况 下 慢 启动 机 制 的 窗口 增 大 速度 是 以 RTT 为 时 间 单 位 随时 间 呈 
指数 级 增长 的 。 为 了 防止 慢 启动 后 期 窗口 增加 速度 过 快 ，TCP 协议 在 慢 启 动机 制 中 增加 了 一 
个 限制 。 在 拥塞 发 生 并 恢复 后 ， 一 旦 通过 慢 启动 机 制 使 得 拥塞 窗口 的 大 小 达到 了 拥塞 之 前 的 
一 半 ，TCP 就 启动 一 个 拥塞 避免 机 制 以 减缓 窗口 扩大 的 速度 。 在 拥塞 避免 机 制 下 ， 只 有 收 到 
当前 窗口 内 所 有 数据 的 确认 后 窗口 才 会 增加 一 个 数据 段 的 大 小 。 


945 “紧急 数据 的 传输 


前 面 讲 到 TCP 协议 在 发 送 应 用 程序 提交 的 数据 之 前 是 经 过 缓存 的 这样 做 的 目的 是 为 了 
在 积累 了 足够 的 数据 后 组 成 一 个 长 度 合适 的 数据 段 进 行 传输 ， 以 提高 数据 传输 的 效率 。 这 一 
点 类 似 于 文件 操作 中 写 文件 的 操作 。 同样 , 在 接收 方 的 TCP 对 于 接收 到 的 数据 可 能 也 会 进行 
缓存 ， 并 在 积累 了 足够 的 数据 后 再 提交 给 上 层 应 用 程序 。 但 有 时 应 用 程序 可 能 有 一 些 数据 需 
要 马上 发 送 到 连接 的 另 一 端 ， 称 这 种 数据 为 紧急 数据 。 对 于 这 些 数据 如 果 仍 然 采用 这 种 机 制 
显然 是 不 合适 的 。 

紧急 数据 可 以 分 为 两 种 。 一 种 数据 是 虽然 需要 马上 发 送 给 连接 的 另 一 端 处 理 ， 但 它 还 是 
需要 对 方 按照 字 节 流 的 顺序 进行 处 理 的 。 因 此 必须 先进 前 面 的 数据 发 送 或 处 理 后 才能 发 送 
或 处 理 该 数据 。 例如 一 台 主机 A 连接 到 另 一 台 主 机 B. 主机 A 有 一 个 终端 界面 接收 用 户 的 输 
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As 这些 输入 需要 传输 到 主机 B 进行 处 理 并 返回 结果 后 A 才能 进行 下 一 步 的 工作 。 但 用 户 输 
入 的 数据 可 能 只 有 几 个 字符 , 显然 不 够 一 个 数据 段 的 长 度 。 因此 TCP 需要 有 一 种 机 制 让 用 户 
指定 马上 将 已 经 提交 的 数据 发 送出 去 ， 而 不 用 进行 缓冲 。 并 让 接收 方 在 收 到 数据 后 马上 将 这 
些 数据 交 给 上 层 应 用 程序 处 理 。 

另 一 种 紧急 数据 称 为 带 外 数据 。 这 种 数据 也 需要 马上 发 送 到 连接 的 另 一 端 进行 处 理 。 但 
和 上 面 第 一 种 不 同 的 是 ， 这 种 数据 需要 对 方 马上 处 理 ， 而 不 管 字 节 流 的 前 面 还 有 多 少数 据 在 
等 待 处 理 。 所 以 ， 准 确 地 讲 ， 带 外 数据 是 另 一 个 数据 流 中 的 数据 ， 和 普通 的 数据 不 在 一 个 字 
节 流 中 ， 且 带 外 数据 的 优先 级 更 高 。 


9.4.5.1 强制 数据 传输 


对 于 第 一 种 紧急 数据 ，TCP 提供 了 一 种 push 操作 。 应 用 程序 可 以 使 用 该 操作 要 求 TCP 
将 缓冲 区 中 的 数据 立即 发 送 到 对 方 。TCP 执行 该 操作 时 并 不 仅仅 是 将 数据 组 织 成 数据 段 发 送 
出 去 ， 它 还 必须 使 用 某 种 手段 通知 接收 方 将 接收 到 的 数据 立即 提交 给 应 用 程序 ( 即 放置 在 某 
个 缓冲 区 中 ,而 不 是 放置 在 TCP 内 部 的 缓冲 区 中 进行 数据 积累 ) 。TCP 使 用 的 方法 就 是 将 数 
据 段 的 PSH 位 置 1。 这 样 , 接收 方 的 TCP 协议 接收 到 该 数据 段 后 就 知道 应 该 立即 将 该 数据 提 
交 给 上 层 应 用 程序 。 
9.4.5.2” 带 外 数据 


带 外 数据 的 传送 是 通过 将 数据 指定 为 紧急 实现 的 。 带 外 数据 在 TCP 数据 段 中 的 传输 以 及 
接收 端 应 用 程序 的 接收 方式 都 和 普通 的 数据 不 同 。 当 应 用 程序 将 带 外 数据 提交 给 TCP 后 ， 
TCP 将 其 放 在 一 个 数据 段 的 数据 区 的 前 部 ， 并 将 数据 段 头 部 的 URG 位 置 1， 同 时 将 紧急 指 
针 字 段 设 置 为 带 外 数据 结束 的 位 置 。 接 收 方 的 TCP 协议 收 到 该 数据 段 后 将 带 外 数据 从 数据 区 
提取 出 来 ， 并 使 用 操作 系统 特定 的 方式 通知 应 用 程序 有 带 外 数据 到 达 并 让 应 用 程序 立即 对 这 
些 数据 进行 处 理 。 这 和 普通 数据 放置 在 缓冲 区 中 等 待 应 用 程序 来 取 是 不 一 样 的 。 


9.5 TCP HAOR 


傻 窗口 症状 是 困扰 早期 的 TCP 实现 的 一 个 严重 的 影响 TCP 协议 性 能 的 问题 。 本 节 中 先 
介绍 傻 窗口 症状 的 特点 及 产生 的 原因 ， 然 后 来 看 看 TCP 是 如 何 解决 这 个 问题 的 。 


9.5.1 傻 窗口 症状 


TCP 协议 的 滑动 窗口 机 制 实现 了 端 到 端的 流量 控制 ,使 得 接收 方 不 至 于 因 发 送 方 的 发 送 
速度 过 快 而 被 数据 淹没 。TCP 协议 通过 在 确认 段 中 提供 一 个 窗口 字段 使 得 接受 方 可 以 将 自己 
当前 的 接收 窗口 大 小 通知 给 发 送 方 。 接 收 方 的 做 法 通常 是 在 接收 到 数据 后 就 试图 将 数据 交 给 
应 用 程序 处 理 。 但 应 用 程序 可 能 正 忙于 其 他 事情 ， 无 暇 处 理 这 些 数 据 。 那 么 接收 方 的 TCP 
协议 只 好 减 小 接收 窗口 的 大 小 。 最 后 极端 的 情况 就 是 接收 方 的 应 用 程序 一 直 没 有 处 理 接收 到 
的 数据 ， 这 样 接收 方 的 TCP 缓冲 区 都 被 接收 到 的 数据 占 满 ， 接 收 窗口 的 大 小 减 小 为 0。TCP 
将 这 个 窗口 大 小 通知 给 发 送 方 TCP。 这 时 整个 数据 传输 就 停 下 来 了 。 如 果 现 在 接收 方 应 用 程 
序 有 空 处 理 数 据 并 提取 了 部 分 的 数据 进行 处 理 了 ，TCP 就 会 发 现 有 部 分 缓冲 区 可 用 。 这 时 
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TCP 会 扩大 接收 窗口 的 大 小 并 将 其 通知 给 发 送 端 , 现在 发 送 端 又 会 发 送 该 窗口 大 小 的 数据 给 
接收 方 。 这 样 整个 数据 的 发 送 和 接收 就 在 这 种 机 制 下 有 序 地 进行 。 

但 现在 情况 出 现 了 。 假 设 现在 接收 方 的 缓冲 区 已 被 数据 占 满 ， 接 收 窗口 缩小 为 0， 数 据 
传输 也 停止 了 。 这 时 ， 接 收 方 的 应 用 程序 从 TCP 缓冲 区 中 取出 1B 的 数据 进行 处 理 。 这 时 接 
收 方 的 TCP 协议 发 现 有 1B 的 缓冲 区 可 用 ,就 将 缓冲 区 的 大 小 设置 为 1 并 将 其 通知 给 发 送 方 。 
KGET] TCP 收 到 该 通知 后 就 将 发 送 窗口 的 大 小 设置 为 1 并 发 送 仅 含 1B 数据 的 数据 段 给 接收 
方 。 现 在 假设 接收 方 以 大 于 等 于 一 个 RTT 的 间隔 每 次 取 1B 的 数据 进行 处 理 。 那 么 发 送 方 每 
次 只 能 发 送 1B 的 数据 , 接收 方 也 只 能 接收 1B 的 数据 。 虽 然 数据 传输 还 是 能 够 有 序 地 进行 下 
去 ， 但 这 种 状况 有 几 个 严重 的 问题 。 

首先 , 总 是 发 送 这 种 数据 包 浪 费 了 网 络 带宽 。 因 为 在 一 个 TCP 段 中 仅 包含 了 1B 的 数据 。 
几乎 所 有 的 数据 都 是 头 部 ， 极 大 地 浪费 了 网 络 带宽 。 其 次 ， 发 送 方 和 接收 方 的 TCP 的 处 理 代 
价 提高 了 ， 因 为 他 们 必须 为 每 个 字 节 而 处 理 一 个 数据 段 ， 包 括 对 缓冲 区 的 分 配 ， 字 段 的 设置 
与 检查 ， 校 验 和 的 计算 与 检查 等 。 再 次 ， 发 送 方 和 接收 方 底层 协议 〈 包 括 IP 协议 和 物理 层 协 
议 ) 的 处 理 负担 加 重 了 ， 因 为 他 们 要 为 每 个 数据 包 或 数据 帧 进行 处 理 。 最 后 ， 网 络 转发 设备 
的 处 理 负担 也 加 重 了 。 

上 面 这 种 情况 因为 窗口 太 小 导致 长 时 间 发 送 小 数据 段 的 现象 称 为 傻 窗口 症状 。 产 生 傻 窗 
口 症状 的 原因 并 不 只 上 面 提 到 的 一 种 。 发 送 方 如 果 处 理 不 适当 也 会 引起 这 种 现象 。 例 如 ， 如 
果 发 送 端的 TCP 协议 不 对 上 层 应 用 程序 提交 的 数据 进行 缓冲 ， 在 应 用 程序 每 次 只 提交 1B 的 
数据 时 也 会 产生 傻 窗口 症状 ， 因 为 它 会 立即 将 这 个 字 节 的 数据 组 织 成 一 个 数据 段 发 送出 去 。 


9.5.2 ” 傻 窗口 症状 避免 机 制 


TCP 协议 在 接收 方 和 发 送 方 都 有 一 套 机 制 来 避免 产生 傻 窗口 机 制 。 发 送 方 的 机 制 主要 用 
来 防止 在 数据 段 中 只 包含 少量 数据 ， 而 接送 方 的 机 制 用 来 防止 发 送 小 的 窗口 通知 给 发 送 方 。 
实际 上 , 在 一 个 连接 中 只 需要 有 其 中 一 方 的 机 制 就 可 以 避免 傻 窗 口 症状 了 , 但 在 实现 时 , TCP 
协议 要 求 发 送 方 和 接收 方 都 要 实现 各 自 的 机 制 。 这 样 要 求 是 为 了 防止 实际 通信 中 某 一 方 不 按 
照 该 机 制 行为 。 所 以 一 个 TCP 协议 的 具体 实现 中 应 该 都 包含 这 两 套 机 制 ， 因 为 TCP 的 数据 
传输 是 全 双 工 的 ， 任 何 一 方 既 会 发 送 数据 也 会 接收 数据 。 


9.5.2.1 接收 方 的 傻 窗口 症状 避免 机 制 


为 了 防止 向 发 送 方 发 送 小 的 窗口 通知 ， 接 收 方 在 向 发 送 方 发 送 过 0 大 小 的 窗口 通知 后 ， 
如 果 应 用 程序 处 理 数据 的 速度 较 慢 ,使 得 产生 的 可 用 缓冲 区 太 小 ，TCP 不 会 马上 将 窗口 扩大 
至 该 缓冲 区 的 大 小 ， 也 不 发 送 窗口 改变 通知 。 它 会 继续 等 待 应 用 程序 处 理 数据 ， 直 到 可 用 的 
缓冲 区 足够 大 之 后 再 扩大 窗口 并 向 发 送 方 发 送 窗口 通知 。 那 么 ， 可 用 缓冲 区 多 大 才 算 足够 大 
We? 这 要 根据 接收 方 的 缓冲 区 的 最 大 大 小 和 最 大 数据 段 长 度 决定 。TCP 协议 将 足够 大 定义 为 
最 大 可 用 缓冲 区 大 小 的 一 半 和 最 大 数据 段 长 度 中 小 的 一 个 。 

接收 方 有 两 种 方法 可 以 实现 上 述 的 这 种 机 制 。 第 一 种 方法 是 接收 方 对 收 到 的 数据 及 时 进 
行 确认 ， 但 如 果 发 现 可 用 窗口 的 大 小 不 能 满足 足够 大 的 要 求 就 发 送 窗口 扩大 通知 。 第 二 种 方 
法 是 在 窗口 大 小 没有 达到 可 以 发 送 窗口 扩大 通知 的 大 小 时 延迟 对 收 到 数据 的 确认 。TCP 协议 
的 标准 推荐 使 用 第 二 种 方法 。 
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延迟 对 接收 数据 的 确认 可 以 减少 网 络 上 不 必要 的 流量 。 首先 , 它 可 以 减少 确认 段 的 数量 ， 
因为 在 这 段 延迟 的 时 间 内 有 新 的 数据 到 达 ，TCP 就 可 以 使 用 一 个 确认 段 对 所 有 的 数据 进行 确 
认 了 。 其 次 ， 在 这 段 时 间 内 可 用 缓冲 区 的 大 小 可 能 会 变 得 足够 大 ， 因 为 应 用 程序 在 不 断 地 处 
理 数据 ， 可 用 缓冲 区 随时 有 可 能 会 增加 。 如 果 是 这 样 ， 那 么 窗口 扩大 通知 就 可 以 和 确认 在 一 
个 数据 段 中 发 送 了 。 

但 延迟 数据 确认 的 发 送 也 有 它 的 缺点 。 如 果 接 收 方 延迟 的 时 间 太 长 ， 发 送 方 在 超时 后 就 
会 重 发 数据 。 重 发 的 数据 不 但 浪费 了 网 络 带宽 , 还 无 谓 地 增加 了 连接 两 端的 处 理 负担 。 另 外 ， 
由 于 TCP 要 使 用 确认 到 达 的 时 间 来 估算 连接 的 RTT， 因 此 延迟 确认 的 发 送 会 增加 RTT 的 大 
小 并 最 终 导致 对 丢失 数据 的 重 发 等 待 时 间 太 长 ， 降 低 数 据 传输 的 效率 。 

为 了 避免 延迟 对 数据 的 确认 的 发 送 ，TCP 标准 规定 对 数据 确认 的 发 送 的 延迟 不 能 超过 
500ms。 另 外 ， 为 了 让 发 送 方 TCP 能 收集 足够 的 RTT 样本 ，TCP 规定 对 其 他 情况 下 的 数据 
段 必 须 逐 一 进行 确认 。 
9.5.2.2 ”发送 方 的 傻 窗口 症状 避免 机 制 


因为 发 送 方 的 应 用 程序 有 可 能 会 提交 少量 的 数据 给 TCP 协议 进行 传输 ， 如 果 TCP 立即 
将 这 些 数 据 组 织 成 数据 段 发 送出 去 就 会 出 现 傻 窗口 症状 。 因此 ，TCP 必须 将 应 用 程序 提交 的 
数据 进行 缓存 , 等 积累 到 足够 多 的 数据 时 再 组 织 数 据 段 发 送出 去 。 现在 的 问题 是 TCP 协议 应 
该 等 待 多 久 ? 因为 TCP 协议 不 知道 应 用 程序 是 否 还 有 数据 需要 传输 ,如 果 等 待 时 间 太 长 , 应 
用 程序 可 能 会 觉得 延 时 太 长 ; 等 的 时 间 太 短 ， 就 会 产生 过 小 的 数据 段 。 实 际 上 ，TCP 协议 根 
本 不 会 计时 ， 它 使 用 的 策略 是 : 如 果 应 用 程序 向 TCP 协议 提交 了 少量 数据 进行 传输 ,而 在 此 
之 前 TCP 已 经 向 接收 方 发 送 过 数据 但 还 没有 收 到 确认 ,TCP 就 将 应 用 程序 提交 的 数据 暂 存在 
本 地 缓冲 区 中 ， 并 不 发 送 ， 直 到 积累 的 待 发 送 的 数据 足够 组 成 一 个 最 大 数据 段 长 的 数据 段 。 
或 者 在 收 到 以 前 数据 的 确认 时 积累 的 数据 还 不 够 多 ，TCP 就 不 再 等 待 ， 将 缓冲 区 中 的 数据 发 
送出 去 。 即 使 对 请 求 了 push 操作 的 数据 也 应 用 该 策略 。 

该 策略 称 为 Nagle 算法 ， 是 根据 其 发 明 人 命名 的 。 该 算法 具有 以 下 几 个 优点 : 首先 ， 它 
几乎 不 需要 发 送 方 为 该 算法 付出 额外 的 处 理 。 它 不 需要 为 每 个 连接 启动 一 个 定时 器 。 其 次 ， 
它 对 各 种 应 用 都 适用 ， 不 会 影响 它们 的 吞吐 量 和 反应 速度 。 


9.6 TCP 协议 与 UDP 协议 的 比较 


很 显然 ，TCP 协议 比 UDP 协议 复杂 得 多 。 在 本 节 中 将 两 者 做 一 个 简单 的 比较 ， 主 要 是 
从 协议 的 应 用 范围 说 明 它 们 的 适应 范围 。 


9.6.1 TCP 协议 与 UDP 协议 特点 的 比较 


首先 ，TCP 是 一 种 面向 连接 的 协议 ， 而 UDP 是 无 连接 的 协议 。 这 其 中 的 区 别 在 于 : 第 
一 ，TCP 协议 是 以 连接 作为 协议 数据 的 最 终 目 标的 。UDP 协议 则 是 以 目标 端口 作为 协议 数据 
的 最 终 目 标 。 因 此 ，TCP 的 协议 端口 是 可 以 复 用 的 ，UDP 协议 的 端口 在 同一 时 间 则 只 能 为 一 
个 应 用 程序 所 用 。 第 二 , 一 个 连接 是 由 两 个 端点 构成 的 。 要 使 用 TCP 进行 通信 必须 先 在 通信 
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双方 之 间 建 立 连 接 ， 连 接 的 两 端 必须 就 连接 的 一 些 问题 进行 协商 〈 如 最 大 数据 段 长 度 、 窗 口 
大 小 、 初 始 序列 号 等 ) ， 并 为 该 连接 分 配 一 定 的 资源 (缓冲 区 ) 。UDP 协议 则 不 需要 这 个 过 
程 ， 可 以 直接 发 送 和 接收 数据 。 

其 次 ，TCP 提供 的 是 可 靠 的 传输 服务 ， 而 UDP 协议 提供 的 是 不 可 靠 的 服务 。 使 用 不 可 
靠 的 服务 进行 数据 传输 时 ， 数 据 可 能 会 丢失 、 失 序 、 重 复 等 。 而 可 靠 的 服务 能 保证 发 送 方 发 
送 的 数据 能 原样 到 达 接 收 方 。 

最 后 ，TCP 提供 的 是 面向 字 节 流 的 服务 。 应 用 程序 只 需 将 要 传输 的 数据 以 字 节 流 的 形式 
提交 给 TCP 协议 ， 在 连接 的 另 一 端 ， 数 据 以 同样 的 字 节 流 顺序 出 现在 接收 程序 中 。 而 UDP 
协议 的 传输 单位 是 数据 块 ， 一 个 数据 块 只 能 封装 在 一 个 UDP 数据 包 中 。 


9.6.2 TCP 协议 与 UDP 协议 应 用 的 比较 


根据 以 上 分 析 的 TCP 协议 和 UDP 协议 的 特点 ,我 们 来 看 看 它们 各 自在 哪些 环境 中 应 用 。 

因为 TCP 协议 提供 了 可 靠 的 面向 字 节 流 的 服务 , 而 且 有 一 套 高 效 的 机 制 保证 数据 的 高 效 
传输 ， 所 以 对 于 有 大 量 数据 需要 进行 可 靠 传 输 的 应 用 是 很 适合 的 ， 因 为 应 用 程序 无 需 关心 如 
何 保证 数据 传输 的 可 靠 性 ， 如 何 进行 超时 重 发 等 。 这 种 应 用 的 典型 例子 就 是 文件 传输 协议 

(FTP) 。 

由 于 TCP 协议 要 先 建立 连接 之 后 才能 进行 通信 ,而 连接 的 建立 过 程 需 要 一 定 的 时 间 。 所 
以 如 果 应 用 程序 只 有 少量 数据 (例如 可 以 在 一 个 数据 包 中 进行 封装 ) 需要 传输 则 不 适合 使 用 
TCP 协议 ， 因 为 连接 建立 的 开销 大 于 其 方便 性 的 优点 。 但 对 于 虽然 数据 量 少 但 需要 时 间 较 长 
且 可 靠 性 要 求 高 的 应 用 TCP 也 是 比较 适合 的 。Telnet 就 是 这 种 应 用 的 一 个 例子 。 

实时 应 用 不 管 数据 量 大 小 ， 不 管 对 可 靠 性 要 求 高 低 都 不 适合 使 用 TCP 协议 ， 因 为 TCP 
协议 对 数据 的 传输 是 有 先后 顺序 的 ， 只 有 前 面 的 传输 成 功 才 会 开始 后 面 的 数据 传送 。 这 显然 
是 不 符合 实时 应 用 的 要 求 的 。 

另外 ,由 于 TCP 协议 是 面向 连接 的 ， 一 个 连接 必须 且 只 能 有 两 个 端点 。 所 以 对 于 多 个 实 
体 间 的 多 播 式 应 用 无 法 使 用 TCP 进行 通信 ， 因 为 对 于 个 实体 间 的 通信 需要 n x @ - 1) /2 
个 连接 。n 很 大 时 连接 数 太 多 。 

对 于 不 适合 使 用 TCP 协议 的 应 用 就 只 能 使 用 UDP 协议 了 。 但 使 用 UDP 协议 进行 通信 时 
应 用 程序 必须 自己 处 理 下 列 问题 : 

COD 应 用 程序 必须 自己 提供 机 制 来 保证 可 靠 性 。 应 用 程序 必须 有 自己 的 超时 重 发 机 制 、 
数据 失 序 的 处 理 、 流 量 控制 等 。 当 然 对 于 一 些 可 靠 性 要 求 不 高 的 应 用 可 以 不 用 这 些 机 制 ， 但 
通常 都 需要 区 分 数据 的 先后 关系 。 

(2) 应 用 程序 必须 自己 处 理 大 块 数据 的 分 割 ， 以 让 其 能 封装 在 一 个 UDP 数据 包 中 。 在 
接收 方 还 必须 再 将 分 割 的 数据 进行 重组 。 


9.6(03 ”常见 的 标准 TCP 协议 端口 
表 9.1 是 常见 服务 的 标准 TCP 端口 及 其 服务 简要 说 明 。 
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表 9.1 标准 TCP 端 口 及 其 说 明 


端 口 号 描 述 
0 保留 
1 TCP 多 路 复 用 器 
5 远程 任务 入 口 
7 回 显 
9 EF 
11 活动 用 户 
13 日 期 时 间 
15 netstat 
17 — qutd 
19 字符 产生 服务 
20 FTP 数据 传输 
21 FIP 
23 TELNET 
25 SMTP 
37 时 间 
42 主机 名 服务 器 
43 Whois 
53 域名 服务 器 
79 Finger 
93 设备 控制 协议 
101 NIC 主机 名 服务 器 
103 网 络 时 间 协 议 
103 X.400 邮件 服务 
104 X.400 邮件 发 送 
113 认证 服务 
119 USENET 新 闻 传 输 协 议 


139 NETBIOS 会 话 服务 


* 10 ”远程 登录 


在 ARPANet 建设 的 初期 ， 计 算 机 尚 属 昂贵 的 资源 。 当 时 PC 机 尚未 普及 , 计算 机 大 多 是 
运行 多 用 户 操作 系统 的 中 小 型 机 。 这 些 中 小 型 机 通常 由 一 台 主机 和 多 个 终端 组 成 ， 主 机 的 计 
算 资源 在 多 个 终端 用 户 间 共 享 ， 系 统 为 每 个 用 户 分 配 一 账号 ， 账 号 规定 了 用 户 对 系统 的 访问 
权限 。 用 户 用 自己 的 账号 在 系统 的 某 一 终端 登录 后 便 可 以 访问 系统 的 部 分 或 全 部 资源 。 
ARPANet 出 现 以 后 ， 远 端 用 户 利用 智能 终端 通过 ARPANet 远程 登录 计算 机 系统 以 共享 异地 
计算 资源 的 需求 便 相应 产生 ， 远 程 登录 协议 即 是 为 满足 这 一 需求 而 设计 的 。 

远程 登录 的 根本 目的 在 于 远 端 用 户 可 以 像 本 地 用 户 一 样 访问 远 地 系 统 的 资源 。 因 此 远程 
登录 协议 设计 的 目标 是 提供 一 个 相对 通用 的 、 双 向 的 、 面 向 8 位 字 节 的 通信 方法 ， 使 得 远 端 
的 终端 设备 能 以 标准 的 方法 与 计算 机 系统 进行 交互 作用 。 目 前 TCP/IP 协议 族 中 有 两 个 远程 
登录 协议 ;Telnet 和 rlogin。Telnet 协议 由 RFC854 定义 了 其 规范 ， 是 Internet. 上 主机 被 要 求 
采用 并 实现 的 标准 srlogin 是 Sun 微 系统 公司 专门 针对 BSD UNIX 系统 而 设计 的 远程 登录 协 

本 章 主要 讨论 Telnet 协议 的 服务 方式 、 工 作 原理 以 及 Telnet 协议 的 主要 命令 ， 并 简要 介 
绍 rlogin 协议 。 


10.1 远程 登录 的 服务 模式 


远程 登录 协议 运行 于 TCP 协议 上 ， 客 户 终端 与 远 地 计 算 机 采用 TCP 连接 进行 通信 。 远 
程 登录 服务 采用 客户 -服务 器 模式 。 如 图 10.1 所 示 ， 在 终端 处 运行 有 Telnet 客户 进程 ， 远 地 
计算 机 系统 处 有 一 服务 器 进程 ， 客 户 进程 和 服务 器 进程 通过 一 条 TCP 连接 进行 交互 。 


Telnet 客户 Telnet 服务 登录 
进程 器 进程 shell 
pa — c a 
1| 终端 1 伪 终 端 
| a TCP/IP | (| TEP 驱动 | 
[| 
| 1 TCP 连 接 1 
终端 用 户 


图 10.1 远程 登录 的 服务 模式 
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这 里 要 注意 的 是 ， 远 程 登录 服务 的 目标 是 为 远 端 用户 提 供与 本 地 用 户 相同 的 服务 。 由 于 
一 般 系统 提供 给 本 地 用 户 的 命令 至 少 有 几 十 条 ， 因 此 系统 同时 要 提供 给 远 端 用 户 这 些 命令 的 
服务 。 这 时 若 单 纯 地 使 用 客户 -服务 器 模式 就 必须 为 每 一 登录 用 户 的 每 一 条 可 能 使 用 的 命令 建 
立 一 个 进程 ， 这 导致 系统 为 接纳 一 个 远程 登录 必须 创建 至 少 几 十 个 服务 器 进程 ， 使 得 系统 的 
扩展 性 差 。 远 程 登录 服务 解决 这 一 问题 的 方案 是 为 每 个 远程 登录 的 用 户 只 创建 一 个 静态 的 
shell 进程 ， 远 端 用 户 的 服务 请 求 均 由 shell 进程 进行 解释 处 理 ， 然 后 动态 地 fork 出 相应 的 进 
程 完 成 具体 的 服务 。 这 样 大 大 减少 了 系统 中 静态 进程 的 数目 ， 避 免 了 系统 进程 数 随 登录 用 户 
数 迅速 膨胀 ， 有 效 解决 了 上 述 的 扩展 性 问题 。 因 此 ，Telnet 远程 登录 在 连接 的 双方 各 只 需 一 
个 应 用 程序 实现 ， 客 户 终端 处 运行 的 程序 是 客户 进程 ， 远 地 计算 机 运行 的 是 服务 器 进程 。 

远 地 提 供 远 程 登录 服务 的 主机 中 始终 运行 有 Telnet 服务 器 进程 ， 随 时 接收 终端 用 户 的 登 
录 请 求 ( 这 类 进程 也 称 为 守护 进程 》。 一 次 远程 登录 的 过 程 是 由 终端 用 户 调用 Telnet 命令 开 
始 的 。 此 时 ， 终 端 处 与 Telnet 命令 相对 应 的 应 用 程序 称 为 客户 。 然 后 客户 与 远 地 计算 机 上 的 
远程 登录 服务 器 建立 TCP 连接 , 远程 登录 服务 器 在 接收 到 连接 请 求 后 为 该 用 户 创建 一 个 shell 
进程 。 在 此 TCP 连接 基础 上 ,客户 将 从 用 户 终端 接收 的 键盘 输入 传 给 服务 器 端的 shell 进程 。 
shell 进程 在 接收 到 终端 用 户 的 命令 后 ， 对 其 进行 解释 并 fork 出 一 子 进程 运行 相应 的 程序 。 命 
令 执行 的 结果 通过 TCP 连接 返回 到 客户 处 。 客 户 再 将 服务 器 返回 的 字符 通过 终端 处 的 操作 系 
统 将 它 显示 在 用 户 终端 上 。 

从 图 10.1 可 以 看 出 的 另 一 点 是 在 Telnet 服 务 中 服务 器 进程 和 客户 进程 均 未 放 入 操作 系统 
内 核 ， 这 主要 是 基于 两 个 考虑 : O 远程 登录 主要 是 服务 于 键盘 类 的 终端 ， 微 秒 级 的 进程 切 
换 所 造成 的 响应 延迟 与 人 的 击 键 速度 相 比 是 微不足道 的 ， 因此 将 Telnet 服务 放 在 应 用 程序 级 
并 不 影响 它 的 正常 工作 。@ 将 Telnet 类 的 程序 作为 应 用 程序 可 以 使 系统 的 内 核 更 紧凑 简洁 ， 
使 得 系统 具有 良好 的 开放 性 和 可 维护 性 。 


10.2 Telnet 原理 


从 10.1 节 的 介绍 知道 Telnet 远程 登录 服务 过 程 分 为 三 个 步骤 : 

第 1 步 ， 远 端 用 户 在 终端 上 对 系统 进行 远程 登录 。 该 远程 登录 的 内 部 视图 实际 上 是 一 个 
TCP 连接 。 

第 2 步 ， 将 远 地 终端 上 的 键盘 输入 逐 键 传 到 主机 系统 。 

第 3 步 ， 将 主机 系统 的 输出 送 回 本 地 系统 。 

这 一 过 程 看 似 简单 ， 但 Intemet 上 主机 和 终端 千差万别 ， 各 自 有 着 不 同 的 生产 厂家 ， 使 
用 了 不 同 的 技术 ,要 使 Telnet 能 在 Internet 上 正常 工作 尚 需 使 输入 /输出 对 远 端 系统 内 核 透 明 。 
Telnet 通过 网 络 虚 终 端 和 选项 协商 机 制 来 实现 这 种 透明 性 。 


10.2.1 网 络 虚 终端 (NVT) 


对 于 Telnet 远程 登录 来 说 ， 系 统 间 的 异 构 性 表现 在 什么 地 方 呢 ? 表现 在 不 同 的 系统 对 键 
盘 输入 的 解释 各 不 相同 。 比 如 行 结束 标志 ， 当 按 下 回 车 键 时 ， 所 有 的 系统 都 会 换行 ， 这 是 相 
同 的 ; 不 同 的 是 ， 有 些 系 统 以 ASCII 字符 CR (Carriage Retum) 作为 行 结束 标志 ， 而 有 些 系 
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统 则 又 以 CR-LF 两 个 字符 作为 行 结束 标志 。 以 不 同 字符 作为 行 结束 标志 的 系统 显然 不 能 直接 
进行 远程 登录 。 又 如 ， 用 于 产生 进程 终止 的 键 码 也 可 能 随 系统 而 不 同 。 有 的 系统 以 Ctrl+C 键 
作为 终止 码 ， 而 有 的 系统 以 Del 键 作为 终止 符 。 再 比如 ， 异 构 系 统 之 间 流 控 字 符 也 可 能 有 差 
异 等 。 为 了 统一 异 构 系 统 对 键盘 输入 的 解释 ，Telnet 专门 提供 一 种 标准 的 键盘 定义 方式 ， 叫 
做 网 络 虚 终 端 (NVT，Network Virtual Terminal) o 

1. NVT 原理 

Internet 中 解决 异 构 性 的 基本 思想 是 各 种 与 设备 相关 的 数据 格式 映射 到 某 个 约定 好 的 且 
与 设备 独立 的 数据 格式 ， 以 封装 屏蔽 设备 的 异 构 性 。 正 如 IP 协议 用 来 屏蔽 不 同 物理 子 网 的 异 
构 性 那样 ，Telnet 采用 NVT 来 屏蔽 不 同 终端 的 不 同 物理 特性 。NVT 的 原理 如 图 10.2 所 示 。 


用 户 终端 gp LIMER | 服务 器 远 地 系 统 
客户 端 系统 格式 NVT 格 式 服务 器 端 格式 
图 10.2 NVT 原理 


在 客户 和 服务 器 两 端 ， 输入 /输出 采用 各 自 的 本 地 格式 。 在 远程 登录 连接 上 ,客户 软件 将 
终端 用 户 输入 转化 为 标准 的 NVT 数据 和 命令 序列 ， 经 TCP 连接 传 到 远 地 机 上 的 服务 器 ， 服 
务 器 再 将 NVT 序列 转化 为 远 地 系 统 的 内 部 格式 。 由 于 客户 和 服务 器 既 了 解 各 自 系统 的 内 部 
格式 ， 又 了 解 NVT 定义 ， 所 以 上 述 转换 很 容易 实现 。 在 NVT 的 作用 下 ， 不 同 的 本 地 格式 得 
以 统一 起 来 ， 在 NVT 一 层 实现 了 一 致 性 。 各 本 地 格式 只 跟 标 准 的 NVT 打交道 ， 而 不 跟 其 他 
具体 格式 直接 互 操作 。 这 样 不 必 针 对 每 个 具体 的 远 地 终端 或 本 地 机 而 编写 客户 或 服务 器 程 
序 ， 使 客户 或 服务 器 程序 需 针 对 宿主 系统 开发 ， 具 有 很 大 的 通用 性 ， 简 化 了 程序 设计 ， 从 而 
为 实现 异 构 系 统 的 互 操 作 打下 了 基础 。 

2. NVT ASCI fà 

术语 NVT ASCII 代表 7 比特 的 ASCII 字符 集 ， 网 间 网 协议 族 都 使 用 NVT ASCII. ^A 
7 比特 的 字符 都 以 8 比特 格式 发 送 ， 最 高 位 比特 为 0。 

在 标准 ASCI 码 的 128 个 字符 中 ， 有 95 个 为 可 见 字 符 〈 包 括 字 母 、 数 字 、 标 点 符号 和 
一 些 特殊 图 形 字符 ) ，NVT 保持 这 些 字符 的 原来 意义 ， 另 外 ， 有 33 个 字符 为 控制 码 ，NVT 
对 其 中 的 8 个 进行 了 重 定义 ， 如 表 10.1 所 示 。 


表 10.1 NVT 对 ASCII 控 制 码 的 重 定义 


ASCII 控制 码 数 值 NVT 意 义 
NUL 0 无 操作 对 输出 无 影响 ) 
BEL im 发 声 光 信号 〈 光 标 不 动 ) 
BS 8 左 移 光标 一 格 
HT 9 水 平 右 移 到 下 一 Tab 位 置 
LF 10 垂直 下 移 一 行 
VT 11 垂直 下 移 到 下 一 Tab 位 置 
FF 12 移 到 下 一 页 头 
CR 13 移 到 本 行 的 左 端 
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行 结束 符 以 两 个 字符 CR (ME) 和 紧 接 着 的 LF RAT) 这 样 的 序列 表示 ， 以 ra 来 表 
示 。 单 独 的 一 个 CR 也 是 以 两 个 字符 序列 来 表示 ， 它 们 是 CR 和 紧 接 着 的 NUL ( 字 节 0) ， 
以 0 表示 。 

许多 系统 给 终端 用 户 提供 一 些 简单 的 控制 命令 ， 比 如 BSD Unix 中 的 Ctre 用 于 终止 当 
前 进程 的 执行 。 控 制 命令 不 是 正常 的 程序 输入 , 不 为 应 用 程序 所 接受 , 而 应 由 操作 系统 解释 。 
NVT 如 何 表 示 控 制 命令 ? NVT 设想 在 用 户 键 盘 上 有 一 组 虚拟 键 ， 用 以 产生 这 类 控制 命令 。 
NVT 一 共 定 义 了 7 个 虚拟 键 ， 如 表 10.2 所 示 。 


表 10.2 NVT 虚 拟 键 
信 号 命 $ 
IP 终止 当前 进程 
AD 抛弃 当前 输出 
AYT 服务 器 测试 
EC 删除 前 一 字符 
EL 删除 当前 行 
SYNCH 带 外 信和 号 
BRK 停止 


这 类 NVT 命令 一 般 由 操作 系统 解释 ， 在 传输 时 应 将 它们 和 Telnet 数据 流 区 分 开 来 。 即 
采用 所 谓 的 带 外 信号 传输 。 为 什么 要 采用 带 外 信号 传输 呢 ? 我 们 以 终止 进程 命令 IP Interrupt 
Process) 为 例 来 说 明 。 卫 命令 一 般 用 在 远 地 进程 发 生 错 误 动作 而 本 地 用 户 想 终止 该 进程 的 时 
候 。 假 如 远 地 进 程 进入 一 个 死 循 环 而 又 不 能 读 写 任何 数据 ， 在 其 输入 缓冲 区 满 后， 客户 再 也 
写 不 进 任何 信息 到 虚 终端 ， 当 然 也 就 写 不 进 IP 命令 。 一 旦 服务 器 无 法 接收 IP 命令 ， 这 远 地 
进程 将 无 休止 地 运行 下 去 ， 直 至 远 地 系 统 关 机 。 因 此 ， 为 避免 这 类 故障 ，NVT 控制 命令 必须 
采用 带 外 信号 传输 。 

当 Telnet 将 控制 命令 放 入 数据 流 时 ， 它 首先 发 送 一 个 SYNCH 命令 ， 然 后 再 发 送 控制 命 
令 ， 最 后 还 要 加 一 个 DMARK 命令 ( 见 102.2 节 ) 。 这 样 就 将 控制 命令 与 一 般 数据 分 开 。 另 
外 , 要 将 带 外 信号 传 给 服务 器 还 要 借助 于 TCP 的 URGENT 机 制 (紧急 数 据 )， 因为 假如 TCP 
连接 因为 远 地 系 统 缓冲 已 满 而 不 接收 数据 ， 则 控制 命令 还 是 传 不 到 服务 器 。 

TCP 将 传输 带 外 信号 的 TCP 报 文 的 “紧急 数据 ”位 置 1， 该 段 便 会 不 受 流 控 的 限制 立即 
传 到 服务 器 。 服 务 器 收 到 紧急 信号 后 ， 读 入 并 抛弃 所 有 数据 ， 直 到 发 现 DMARK 标志 。 然 后 
服务 器 再 转 入 正常 工作 ， 将 控制 命令 交 给 操作 系统 执行 。 


10.2.2 Telnet 命令 


Telnet 通信 的 两 个 方向 都 采用 带 内 信 令 方式 ， 即 Telnet 命令 放 入 数据 流 中 传输 。 这 就 需 
要 能 将 Telnet 命令 同 普通 数据 区 分 开 来 。Telnet 采用 了 转 义 序列 的 办 法 。 每 个 转 义 序列 由 两 
个 字 节 构成 , 前 一 个 字 节 是 Oxff (十 进 制 的 255) 叫做 IAC Cinterpret as command, 意思 是 “ 作 
为 命令 来 解释 ”) ， 其 作用 是 指出 该 字 节 后 面 的 一 个 字 节 是 命令 字 节 。 如 果 要 发 送 数据 255, 
就 必须 发 送 两 个 连续 的 字 节 255。 将 Telnet 命令 与 标准 ASCH 码 分 开 的 优点 是 增加 了 Telnet 
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的 灵活 性 ,使 Telnet 可 以 传输 所 有 可 能 的 字符 序列 和 命令 序列 。 表 10.3 给 出 了 所 有 的 Telnet 
命令 。 


表 10.3 Telnet 命令 集 


* 4 十 进 制 编码 9 x 
IAC 255 转 义 序列 开始 符 
DONT 254 拒绝 执行 指定 选项 的 请 求 
DO 253 批准 开放 指定 选项 
WON'T 252 拒绝 执行 指定 选项 
WILL 251 同意 执行 指定 选项 
SB 250 选项 协商 开始 
GA 249 继续 进行 
EL 删除 行 
EC 删除 前 一 字符 
AYT 对 方 是 否 在 运行 
AO 245 异常 终止 输出 
IP 中 断 进 各 
BRK 中 断 
DMARK 数据 标记 
NOP 无 操作 
SE 选项 协商 结束 
EOR 记录 结束 符 
ABORT 异常 终止 进程 
SUSP 挂 起 当前 进程 
EOF 236 文件 结束 符 

10.2.3 选项 协商 


在 Telnet 中 ， 系 统 的 异 构 性 除了 终端 对 键盘 输入 解释 的 区 别 外 ， 不 同 的 终端 系统 在 功能 
等 方面 也 存在 着 种 种 差别 。 如 有 些 终端 只 能 工作 于 半 双 工 方式 ， 而 一 些 终端 却 可 以 在 全 双 工 
下 工作 ，NVT 对 屏蔽 系统 间 的 这 类 差异 是 无 能 为 力 的 。Telnet 提供 了 选项 协商 机 制 来 解决 这 
一 问题 。 

Telnet 连接 的 双方 在 建立 起 NVT 通信 之 前 , 首先 交互 选项 协商 数据 。 选 项 协商 是 对 称 的 ， 
也 就 是 说 , 任何 一 方 都 可 以 主动 发 送 选项 协商 请 求 给 对 方 。 选 项 协商 需要 3 个 字 节 : 一 个 IAC 
字 节 , 接着 一 个 字 节 是 选项 协商 命令 , 最 后 一 个 字 节 是 本 次 协商 要 激活 或 禁止 的 具体 选项 ID。 

1. Telnet 选项 

现在 ， 有 40 多 个 选项 是 可 以 协商 的 。AssignedNumber RFC 文档 中 指明 选项 字 节 的 值 ， 
并 且 一 些 相关 的 RFC 文档 描述 了 这 些 选 项 。 表 10.4 显示 了 一 些 常 用 的 选项 代码 。 

Telnet 的 选项 协商 机 制 和 Telnet 协议 的 大 部 分 内 容 一 样 ， 是 对 称 的 。 连 接 的 双方 都 可 以 
发 起 选项 协商 请 求 。 但 我 们 知道 ， 远 程 登录 不 是 对 称 的 应 用 。 客 户 进程 完成 某 些 任务 ， 而 服 
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务 器 进程 则 完成 其 他 一 些 任务 。 下 面 将 看 到 ， 某 些 Telnet 选项 仅仅 适合 于 客户 进程 (例如 要 
求 激活 行 模式 方式 ) ， 某 些 选 项 则 仅仅 适合 于 服务 器 进程 。 


表 10.4 ”常用 的 Telnet 选 项 


选项 标识 名 HW RFC 
1 回 显 857 
3 抑制 继续 进行 | 858 
5 状态 | 859 
6 请 求 时 间 标 志 插入 返回 流 860 
24 交换 关于 终端 的 型 号 信息 | 1091 
31 窗口 大 小 1073 
32 终端 速率 1079 
远程 流量 控制 


2. 选项 协商 命令 

对 于 任何 给 定 的 选项 ， 连 接 的 任何 一 方 都 可 以 发 送 下 面 4 种 请 求 的 任意 一 个 请 求 。 

(D WILL: 发 送 方 本 身 将 激活 Cenable) 选项 。 

(2) DO : 发 送 方 想 叫 接收 端 激活 选项 。 

(3) WONT : 发 送 方 本 身 想 禁止 选项 。 

(4) DON'T: 发 送 方 想 让 接收 端 去 禁止 选项 。 

由 于 Telnet 规则 规定 ， 对 于 激活 选项 请 求 ， 如 (1) 和 (2) ， 有 权 同 意 或 者 不 同意 。 而 
对 于 使 选项 失效 请 求 ， 如 GO WU GOD ， 必 须 同意 。 这 样 ，4 种 请 求 就 会 组 合 出 6 种 情况 ， 
如 表 10.5 所 示 。 


表 10.5 ”选项 协商 命令 的 6 种 组 合 


REAR Hi g 

i WILL 发 送 方 想 激活 选项 
接收 方 说 同意 

WILL 发 送 方 想 激活 选项 
接收 方 说 不 同意 

J DO 发 送 方 想 让 接收 方 激活 选项 
接收 方 说 同意 

i DO 发 送 方 想 让 接收 方 激活 选项 
接收 方 说 不 同意 

" WONT 发 送 方 想 禁止 选项 
接收 方 必须 说 同意 

DON.T 发 送 方 想 让 接收 方 禁止 选项 
接收 方 必须 说 同意 


3. 子 选项 协商 


第 10 章 远程 登录 


有 些 选项 不 是 仅仅 用 “激活 ”或 “禁止 ”就 能 够 表达 的 。 指 定 终端 类 型 就 是 一 个 例子 ， 
客户 进程 必须 发 送 一 个 ASCH 字符 串 来 表示 终端 类 型 。 为 了 处 理 这 种 选项 ,我 们 必须 定义 子 
选项 协商 机 制 。 在 RFC1091[VanBokkelen 1989] 中 定义 了 如 何 表示 终端 类 型 这 样 的 子 选项 协 
商机 制 。 

首先 连接 的 某 一 方 ( 通 常 是 客户 进程 ) 发 送 3B 的 字符 序列 <IAC, WILL, 24> 来 请 求 激活 
该 选项 。 如 表 10.4 所 示 ， 这 里 的 24 表示 终端 类 型 选项 。 如 果 接 收 端 (通常 是 服务 器 进程 ) 
同意 ， 那 么 响应 数据 是 : 

<IAC, DO, 24> 
然后 服务 器 进程 再 发 送 如 下 的 字符 串 : 
<IAC, SB, 24, 1, IAC, SE> 

该 字符 串 询问 客户 进程 的 终端 类 型 。 其 中 ，SB 是 子 选项 协商 的 起 始 命令 标志 。 下 一 个 字 节 
的 “24” 代 表 这 是 终端 类 型 选项 的 子 选项 〈 通 常 SB 后 面 的 选项 值 就 是 子 选项 所 要 提交 的 内 
容 ) 。 下 一 个 字 节 的 “1” 表 示 “ 发 送 你 的 终端 类 型 ”。 子 选项 协商 的 结束 命令 标志 也 是 LAC, 
BUR SB 是 起 始 命令 标志 一 样 。 

如 果 终 端 类 型 是 ibm pc， 客 户 进程 的 响应 命令 将 是 : 

<IAC, SB, 24, 0T’, ‘B’, ‘M’, ‘P’, ‘C’, IAC, SE> 

第 4 个 字 节 “0” 代 表 “ 我 的 终端 类 型 是 ”。 在 Telnet 子 选项 协商 过 程 中 ， 终 端 类 型 用 大 写 
表示 ， 当 服务 器 收 到 该 字符 串 后 会 自动 转换 为 小 写字 符 。 

4. 选项 协商 示例 

对 于 大 多 数 Telnet 的 服务 器 进程 和 客户 进程 ， 共 有 半 双 工 、 一 次 一 字符 、 一 次 一 行 和 
行 方式 等 4 种 操作 方式 。 其 中 一 次 一 字符 方式 为 大 多 数 Telnet 程序 的 默认 工作 方式 。 一 次 
一 字符 方式 是 指 用 户 在 终端 输入 的 每 个 字符 都 将 由 终端 发 送 到 服务 器 进程 ， 服 务 器 进程 的 
响应 也 将 以 字符 方式 回 显 到 终端 上 。 下 面 我 们 以 一 次 一 字符 方式 为 例 说 明 Telnet 的 选项 协 
商 过 程 。 

假设 客户 端 运行 的 是 较 新 版 本 的 Telnet 程序 ， 而 服务 器 端 运行 的 Telnet 版 本 较 旧 。 客 户 
端 在 建立 Telnet 连接 时 试图 激活 较 多 的 选项 ， 服 务 器 由 于 不 支持 其 中 某 些 选项 而 加 以 拒绝 。 
整个 协商 过 程 如 图 10.3 所 示 。 

10.3 中 协商 过 程 的 含义 如 下 : 

(1) 客户 发 起 SUPPRESS GO AHEAD 选项 协商 。 由 于 GO AHEAD 命令 通常 是 由 服务 
器 发 送 给 客户 的 ， 而 且 客户 希望 服务 器 激活 该 选项 ， 因 此 该 选项 的 请 求 方式 是 DO。 服 务 器 
进程 的 响应 是 WILL SUPPRESS GO AHEAD， 即 同意 该 选项 。 

(2) 客户 进程 要 按照 在 RFC 1091[VanBokkelen 1989] 中 的 定义 发 送 终端 类 型 。 因 为 客户 
进程 要 激活 本 地 的 选项 ， 所 以 该 选项 的 请 求 方式 是 WILL。 服 务 器 进程 同意 激活 终端 类 型 选 
项 。 但 现在 客户 进程 还 不 能 立即 发 送 它 的 终端 类 型 。 它 必须 要 等 到 服务 器 进程 用 子 选 项 的 形 
式 询 问 终端 类 型 的 时 候 才 能 够 发 送 。 

(3) NEWS 的 意思 是 “协商 窗口 大 小 ”， 它 在 RFC 1073 [Waitz m an] 中 有 定义 。 
WILL NEWS 是 指 客户 端 要求 协 商 窗口 大 小 ， 服 务 器 回应 DON'T NEWS 加 以 拒绝 。 

(4) TSPEED 选项 允许 发 送 方 〈 通 常 是 客户 进程 ) 发 送 它 的 终端 速率 ， 这 在 RFC 
1079[Hedrick 1988b] 中 有 定义 。 如 果 服 务 器 进程 同意 ， 客 户 进程 将 发 送 其 发 送 速率 和 接收 速 
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率 的 子 选 项 。 服 务 器 发 送 DON’T TSPEED， 拒 绝 该 请 求 。 
客户 端 服务 器 端 


T7-7----- }<— DO TERMINAL TYPE 

\<— WILL SUPPRESS GOAHEAD 
\<— DO TERMINAL TYPE 
\<— DON’ T NEWS 

网 间 网 ”DON T TSPEED 

TCP 连 接 («DON TLFLOW 

[<— DON’ T LINEMODE 
\<—DON’ T ENVIRON 

\<— WONT STATUS 


—---4*- IAC TERMINAL TYPE SEND 
IAC TERMINAL TYPE IS "IBMPC3"—»,———7— 


图 10.3 选项 协商 过 程 


CGOLFLOW 代表 “本 地 流量 控制 ”这 在 RFC1371 [Hedrick # Borman 1992] 中 定 。 义 。 
客户 进程 给 服务 器 进程 发 送 该 选项 ， 表 示 客 户 进程 希望 用 命令 方式 激活 或 禁止 流量 控制 。 
本 例 中 服务 器 不 支持 该 请 求 。 

(6) LINEMODE 代表 实行 方式 。 所 有 终端 字符 的 处 理由 Telnet 客户 进程 完成 (例如 
回 格 、 删 除 行 等 ) ， 然 后 整 行 发 送 给 服务 器 进程 。 该 选项 同样 被 服务 器 进程 拒绝 。 

(7) ENVIRON 选项 允许 客户 进程 把 环境 变量 发 送 给 服务 器 进程 ， 这 在 RFC 1408 
[Borman 1993a] 中 有 定义 。 这 样 就 可 以 把 客户 进程 的 用 户 环境 变量 自动 传播 到 服务 器 进程 。 
服务 器 进程 拒绝 该 选项 。 

(8) STATUS 选项 (RFC 859 [Postel 和 Reynolds 1983e] 中 定义 ) 允许 连接 的 一 方 询问 
对 方 对 Telnet 选项 目前 状态 的 理解 。 客 户 进程 要 求 对 方 激活 选项 (DO) 。 如 果 服 务 器 进程 
同意 客户 进程 就 可 以 要 求 服务 器 进程 以 子 选项 的 形式 发 送 它 的 状态 值 。 在 这 个 例子 中 ， 服 务 
器 拒绝 了 该 请 求 。 

(9) 服务 器 发 送 LAC TERMINAL TYPE SEND 要 求 客户 进程 发 送 终端 类 型 子 选 项 ; 客 
户 进程 把 终端 类 型 “IBMPC3” 以 6B 的 字符 串 形式 发 送 给 服务 器 进程 。 


10.3 rlogin 


Tlogin 的 第 一 次 发 布 是 在 4BSD 中 ， 当 时 它 仅 能 实现 Unix 主机 之 间 的 远程 登录 。 这 就 使 
44 rlogin HE Telnet 简单 得 多 。 由 于 客户 进程 和 服务 器 进程 的 操作 系统 预先 都 知道 对 方 的 操作 
系统 类 型 ， 不 必 太 考虑 异 构 性 处 理 ， 所 以 就 不 需要 选项 协商 机 制 。rlogin 支持 以 下 功能 : 
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(1) 信任 主机 
管理 员 可 以 选 出 一 组 主机 ， 叫 做 信任 主机 ， 赋 予 它们 共享 资源 的 特权 。 通 过 rlogin, 在 
信任 主机 之 间 可 以 共享 登录 名 ( 即 用 户 账号 ) 和 文件 访问 权限 ,而 且 任 何 登录 (本 地 或 远程 ) 
都 是 平等 的 。 
(2) 自动 授权 机 制 
用 户 可 以 把 自己 账号 的 访问 权 赋 予 远程 登录 。 比 如 ， 本 地 机 X 用 户 可 以 允许 远 地 机 H 
上 的 了 用 户 访问 自己 的 账号 。 这 样 , 假如 Y EH EERE, MA rlogin 登录 进入 义 账 号 ， 
便 不 需 再 输入 口令 。 
(3) 上 述 自动 授权 机 制 还 可 用 于 通用 程序 执行 
比如 ,假设 主机 HI 上 的 义 用 户 将 自身 账号 的 访问 权 赋 予 H2 主机 上 的 了 用 户 ， 则 立 可 
以 直接 在 H2 上 执行 X 也 可 以 执行 的 Hl 上 的 命令 : 
H2.Y>rsh H1 command [parameter] 
Rsh 是 rlogin 的 变形 ， 它 表面 上 省 略 了 rlogin 的 过 程 ， 由 内 部 隐藏 执行 。Y 执行 rsh 实际 上 分 
为 两 个 步骤 。 
第 1 步 ， 隐 藏 执行 : 
rlogin H1 X 
第 2 步 ， 执 行 ; 
command [parameter] 
其 中 ， 由 于 第 1 步 中 XX 已 对 Y 授权， 所 以 不 会 出 现 “password” 提 示 符 ， 也 就 不 必 再 输入 YY 
的 口令 。 
另外 ，rsh 的 执行 效果 相当 于 直接 在 远 地 机 上 执行 一 条 命令 ， 标 准 输入 来 自 本 地 机 ， 标 
准 输 出 去 往 本 地 机 。 如 同 本 地 登录 一 样 ,rlogin Fil rsh 也 可 进行 输入 /输出 重 定向 及 流 控 等 HR 
作 。 
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电子 邮件 是 Internet 上 的 最 早 应 用 之 一 , 最 早出 现在 Internet 前 身 ARPANET E. HFE 
子 邮 件 与 传统 邮件 相 比 具有 传递 快速 ， 风 雨 无 阻 的 优点 ， 同 时 又 不 像 电话 那样 需要 通信 双方 
同时 在 场 ， 因 此 电子 邮件 应 用 出 现 后 发 展 迅 速 ， 目 前 已 成 为 Intemet 上 最 流行 的 应 用 之 一 。 
有 资料 表明 ，TCP 连接 的 一 半 以 上 是 用 于 简单 邮件 传输 协议 的 。 现 有 的 各 种 网 络 体系 结构 也 
无 一 例外 地 把 电子 邮件 作为 一 个 重要 的 应 用 ， 纳 入 自己 的 协议 族 。 

本 章 主 要 介绍 TCP/IP 电子 邮件 系统 结构 原理 以 及 TCP/IP 的 电子 邮件 协议 。 


11.1 电子 邮件 系统 结构 


传统 的 邮件 服务 对 我 们 来 说 是 再 熟悉 不 过 的 了 ， 其 工作 流程 在 第 3 章 已 有 说 明 。 电 子 邮 
件 作 为 传统 邮件 业务 在 网 络 时 代 的 衍生 物 也 有 着 类 似 的 工作 过 程 。 图 11.1 给 出 了 TCP/IP 邮 
件 系统 的 示意 图 。 


图 11.1 TCP/IP 邮件 系统 示意 图 


无 论 是 传统 邮件 业务 还 是 电子 邮件 系统 ， 需 要 解决 的 首要 问题 是 邮件 的 传输 。 传 统 的 邮 
件 是 由 从 发 信和 邮局 到 收 信 邮局 沿途 的 邮局 接力 传递 的 。TCP/IP 电子 邮件 系统 与 之 有 所 不 同 。 
这 是 由 于 TCP/IP 自始至终 坚持 端 到 端的 思想 ， 它 的 电子 邮件 系统 也 不 例外 地 采用 了 端 到 端 
的 传输 方式 。 在 TCP/IP 电子 邮件 系统 中 负责 邮件 传输 的 部 分 称 作 邮件 传送 代理 。 邮 件 传 送 
代理 采用 客户 机 /服务 器 模式 工作 , 发 送 方 的 传送 代理 作为 客户 机 , 接收 方 的 代理 作为 服务 器 。 
在 邮件 传输 时 由 发 送 方 发 起 连接 请 求 , 服务 器 响应 后 建立 起 TCP 连接 , 邮件 信息 便 在 此 TCP 
连接 上 进行 传输 。 在 发 送 方 的 传送 代理 和 接收 方 代理 之 间 一 般 不 进行 邮件 的 存储 和 转发 ， 这 
是 TCP/IP 电子 邮件 系统 与 ISO/OSI 电子 邮件 系统 的 最 大 区 别 ， 后 者 是 采用 存储 转发 方式 工 
作 的 ， 更 类 似 于 传统 的 邮件 业务 。 

除了 邮件 传输 外 ， 电 子 邮 件 系统 还 必须 解决 如 下 问题 : 

(1) 邮件 编辑 

该 功能 是 帮助 用 户 编写 邮件 并 为 邮件 填写 地 址 和 其 他 控制 信息 。 
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(2) 转换 及 格式 化 

转换 是 指 将 信息 转换 成 适合 于 在 接收 者 终端 上 显示 或 打印 的 格式 。 格 式 化 是 指 解决 邮件 
在 接收 者 终端 上 的 格式 化 显示 问题 。 对 邮件 显示 格式 的 最 直接 处 理 方式 是 : 电子 邮件 系统 传 
来 未 格式 化 邮件 ， 由 用 户 调用 格式 化 程序 进行 处 理 ， 再 调用 显示 程序 (如 编辑 器 ) 对 格式 化 
文件 进行 阅读 。 这 种 处 理 方式 对 无 经 验 的 用 户 是 很 困难 的 。 最 好 是 电子 邮件 系统 能 直接 显示 
格式 化 邮件 ， 这 样 用 户 操作 就 大 大 简化 了 。 

(3) 邮件 处 置 

帮助 接收 者 处 理 所 收 到 的 邮件 ， 包 括 立 即 扔 掉 、 读 完 扔 掉 、 读 后 保存 、 转 发 邮件 和 阅读 
旧 邮 件 等 操作 。 

上 述 这 些 功 能 均 由 用 户 代理 来 实现 。 用 户 代理 是 用 户 使 用 邮件 系统 的 界面 ， 它 不 仅 可 以 
帮助 用 户 完成 编辑 邮件 、 显 示 和 处 置 邮件 等 工作 ， 同 时 还 隐藏 了 邮件 传输 的 复杂 性 。 即 用 户 
在 使 用 邮件 系统 时 ， 只 需 与 用 户 代理 打交道 而 无 需 了 解 传送 代理 工作 过 程 。 这 大 大 方便 了 用 
户 对 邮件 系统 的 使 用 。 

在 图 11.1 所 示 的 系统 中 , 还 有 两 个 部 分 : 接收 者 邮箱 和 邮件 发 送 的 Spooling 区 。 其 中 接 
收 者 邮箱 的 含义 和 功能 是 不 言 自 明 的 ， 它 是 邮件 传送 的 目的 地 。 每 个 邮件 系统 的 使 用 者 都 至 
少 拥有 一 个 邮箱 ， 邮 箱 是 私有 的 ， 电 子 邮 件 系统 的 软件 可 以 往 邮 箱 中 添加 一 封 邮件 ， 但 只 有 
邮箱 拥有 者 才能 检查 或 删除 该 邮件 。 而 邮件 发 送 的 Spooling 区 是 发 送 邮件 的 缓存 队列 。 
Internet 上 的 主机 可 能 会 由 于 故障 或 网 络 拥塞 等 原因 导致 暂时 的 无 法 访问 , 设立 发 送 邮件 缓存 
区 主要 就 是 解决 接收 方 主机 暂时 不 能 访问 时 ， 如 何 发 送 电子 邮件 的 问题 。 用 户 通过 用 户 代理 
写 好 邮件 ， 提 交 发 送 后 邮件 即 进入 缓存 区 。 发 送 方 传送 代理 将 周期 性 地 检查 发 送 缓冲 区 ， 每 
当 它 发 现 未 发 邮件 ， 或 用 户 传 来 一 个 新 邮件 ， 传 送 代理 立即 着 手 发 送 。 当 发 现 某 邮件 很 长 时 
间 都 发 不 出 去 ， 传 送 代理 将 它 返回 发 送 者 。 


11.2 TCP/IP 电子 邮件 地 址 


电子 邮件 地 址 即 邮箱 地 址 ，Intemet 上 每 个 邮箱 必须 有 惟一 的 地 址 。TCP/IP 电子 邮件 系 
统 的 编 址 采用 了 两 层 的 方案 ， 即 每 个 地 址 由 两 部 分 组 成 ， 两 部 分 之 间 用 “@” 隔 开 。 其 格式 
如 下 : 

local-part@domain-name 

第 一 部 分 为 本 地 名 ， 即 邮箱 名 ， 它 可 以 是 用 户 起 的 任意 名 字 ， 只 要 不 与 同一 邮件 服务 器 
上 的 其 他 邮箱 重 名 。“@” 后 的 为 第 二 部 分 ， 它 是 邮件 服务 器 所 在 主机 的 域名 。 由 于 域名 是 
全 网 惟一 的 ， 因 此 这 种 编 址 方案 保证 了 每 个 邮箱 的 地 址 也 是 惟一 的 。 

另 一 方面 ， 采 用 两 层 的 编 址 还 有 两 个 优点 。 第 一 ， 这 种 划分 允许 每 个 计算 机 系统 规定 自 
己 的 邮箱 的 标识 ， 不 同 的 计算 机 可 以 使 用 不 同 的 邮箱 标识 机 制 ， 也 可 以 使 用 相同 的 邮箱 标识 
机 制 。 第 二 ， 这 种 划分 允许 任意 计算 机 系统 上 的 用 户 交换 电子 邮件 信息 。 发 送 方 计算 机 上 的 
电子 邮件 软件 在 发 送信 息 时 使 用 地 址 中 的 第 二 个 部 分 来 确定 要 连接 的 计算 机 。 接 收 方 的 计算 
机 上 的 电子 邮件 软件 使 用 地 址 中 的 第 一 个 部 分 来 选择 邮箱 将 信息 放 进去 。 这 样 ， 地 址 的 第 一 
个 部 分 是 本 地 翻译 的 ， 该 字符 串 在 一 个 计算 机 系统 之 外 没有 任何 意义 。 
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11.3 ”电子 邮件 格式 


11.3.1 电子 邮件 信息 格式 


电子 邮件 信息 的 格式 很 简单 ， 由 RFCS22 定义 了 TCP/IP 电子 邮件 的 信息 格式 。 信 息 由 
ASCI 文本 组 成 ， 包 括 两 个 部 分 ， 中 间 用 一 个 空 行 分 隔 。 第 一 部 分 是 一 个 头 部 (header) , 
包括 有 关 发 送 方 、 接 收 方 、 发 送 日 期 和 内 容 格式 等 控制 信息 。 第 二 部 分 是 正文 (body) ， 包 
括 信息 的 文本 。 

虽然 信息 的 正文 可 以 包含 任意 文本 , 但 电子 邮件 软件 在 收发 信息 时 仍 使 头 部 保持 标准 形 
式 。 每 个 头 部 行 首先 是 一 个 关键 字 ， 一 个 冒号 ， 然 后 是 附加 的 信息 。 关 键 字 告诉 电子 邮件 软 
件 如 何 翻译 该 行 中 剩 下 的 内 容 。 有 些 关键 字 在 电子 邮件 头 部 是 必需 的 ， 另 一 些 是 可 选 的 。 例 
如 ， 每 个 头 部 必须 包含 以 To 开头 的 行 ， 说 明 一 个 接收 方 的 列表 。 这 行 中 To 和 随后 的 冒号 之 
后 的 内 容 包含 了 一 个 或 多 个 电子 邮件 地 址 ， 每 个 地 址 对 应 一 个 接收 方 。 电 子 邮 件 软件 在 电子 
邮件 的 头 部 放置 一 个 以 From 开头 的 行 ， 其 后 跟随 的 是 发 送 方 的 电子 邮件 地 址 。 图 11.2 是 一 
个 电子 邮件 信息 的 实例 ， 以 说 明 头 部 行 的 形式 。 


From: wang@sina.com 


To: zhang@163.net 
Date: Fri, 18 Dec 2003 12:30:30 


Subject: 你 好 吗 ? 


uk, 
好 久未 联系 ， 你 近来 可 好 ? 有 空 来 我 这 儿 好 好 聊 聊 。 
老 王 


图 11.2 一 个 邮件 实例 


图 中 显示 了 两 个 附加 的 行 ， 包 括 信息 发 出 的 日 期 及 信息 的 主题 。 这 两 个 都 是 可 选 的 ， 发 
送 方 的 电子 邮件 软件 选择 是 否 包含 它们 。 除 了 上 例 中 的 关键 字 外 RFC822 还 定义 了 其 他 一 些 
关键 字 ， 如 关键 字 Cc 用 来 表明 邮件 副本 的 抄 送 地 址 ，Reply-To 用 来 表明 邮件 的 回复 地 址 ， 
X-Mailer 用 来 指明 发 送 邮 件 所 使 用 的 软件 等 。 


11.3.2 ”多 用 途 互 联网 邮件 扩充 


最 初 的 因特网 电子 邮件 系统 被 设计 为 只 能 处 理 文本 。 信 息 的 正文 被 限制 为 可 打印 的 
ASCII 字符 ， 不 能 包含 任意 值 的 字 节 。 特 别 是 不 能 直接 将 二 进 制 文件 作为 邮件 消息 的 正文 。 
但 人 们 在 使 用 电子 邮件 系统 的 过 程 中 发 现 常常 需要 将 一 些 大 小 为 几 十 KB 一 几 MB 的 小 文件 
随同 邮件 一 同 发 送 ， 但 电子 邮件 只 能 传送 文本 的 限制 导致 了 大 大 的 不 便 。 
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为 了 适应 这 种 需求 , 研究 人 员 修改 了 这 种 模式 , 从 而 允许 用 电子 邮件 传送 任意 的 数据 (如 
二 进 制程 序 或 图 片 ) 。 一 般 的 方案 都 是 将 数据 编码 为 文本 形式 ， 放 在 邮件 的 消息 中 发 送 。 在 
接收 方 ， 消 息 正 文 被 抽取 出 来 ， 转 换 回 二 进 制 形式 。 例 如 ， 一 种 方法 是 使 用 十 六 进 制 表 示 。 
二 进 制 数据 中 每 四 位 作为 一 个 单元 映射 到 0 一 9 及 A~ 下 的 一 个 字符 。 然 后 在 电子 邮件 信息 中 
发 送 这 个 字符 序列 ， 由 接收 方 将 这 些 字符 翻译 回 二 进 制 。 

为 了 帮助 协调 和 统一 发 送 二 进 制 数据 而 人 们 提出 了 多 种 编码 方案 ， 其 中 最 为 广泛 使 用 的 
是 IETF 所 提 的 MIME， 即 多 用 途 互 联网 邮件 扩充 (Multipurpose Internet Mail Extension) o 
MIME 并 不 指定 一 种 二 进 制 数据 的 编码 标准 , 而 是 允许 发 送 方 和 接收 方 选 择 方便 的 编码 方法 。 
在 使 用 MIME 时 ， 发 送 方 在 头 部 包含 一 些 附加 行 说 明 信 息 遵循 MIME 格式 ， 以 及 在 主体 中 
增加 一 些 附加 行 说 明 数 据 类 型 和 编码 。 除 了 在 发 送 方 和 接收 方 之 间 提 供 一 致 的 编码 方式 外 ， 
MIME 还 允许 发 送 方 将 信息 分 成 几 个 部 分 ， 并 对 每 个 部 分 指定 不 同 的 编码 方法 。 这 样 ， 用 户 
就 可 以 在 同一 个 信息 中 既 发 送 普通 文本 又 附加 (attach) 一 个 图 像 了 ,这 就 是 现今 邮件 中 的 附 
件 。 当 接收 者 查看 消息 时 ， 电 子 邮 件 系统 显示 出 文本 消息 ， 然 后 询问 用 户 如 何 处 理 附加 的 图 
像 〈 即 在 磁盘 上 保存 一 个 副本 或 在 屏幕 上 显示 副本 ) 。 当 用 户 决定 了 如 何 处 理 附 件 时 ，MIME 
软件 自动 解码 附加 的 数据 。 

为 了 透明 地 编码 和 解码 ，MIME 在 电子 邮件 头 部 增加 了 两 行 : 一行 用 来 声明 使 用 MIME 
生成 信息 ， 另 一 行 说 明 MIME 信息 是 如 何 包 含 在 正文 中 的 。 例 如 ， 头 部 的 行 

MIME-Version: 1.0 

Content-Type: Multipart/Mixed; Boundary=Mime separator 
说 明了 信息 是 使 用 MIME 版 本 1.0 生成 的 ， 并 且 包 含 Mime_separator 的 行将 出 现在 正文 信息 
的 每 个 部 分 之 前 。 当 MIME 用 来 发 送 标准 文本 信息 时 , 第 二 行 变 为 : Content-Type: text/plain. 
表 11.1 列 出 了 某 些 公 用 的 MIME 内 容 类 型 。 


表 11.1 某 些 公用 的 MIME 内 容 类 型 


Gif 格 式 图 像 


JPEG 格式 图 像 

PNG 格式 图 像 

MPEG 格式 影像 
Video/quicktime Quicktime 格式 影像 


MIME 的 主要 优点 在 于 它 的 灵活 性 。 这 种 标准 并 不 规定 所 有 的 发 送 方 和 接收 方 必 须 使 用 
单一 的 编码 方式 。 取 而 代 之 的 是 ，MIME 允许 使 用 任何 时 候 发 明 的 新 的 编码 方式 。 发 送 方 和 
接收 方 只 要 能 同意 一 种 编码 方式 及 对 该 编码 方式 使 用 同一 名 字 ， 就 可 以 使 用 传统 的 电子 邮件 
进行 通信 。 进 一 步 ，MIME 没有 规定 用 来 划分 各 部 分 所 用 的 具体 值 或 用 来 命名 编码 方案 的 方 
式 。 发 送 方 可 以 选择 主体 中 不 会 出 现 的 任意 字符 串 作 为 分 隔 符 ， 接 收 方 使 用 头 部 的 信息 来 决 
定 怎样 将 信息 解码 。MIME 与 老 的 电子 邮件 系统 是 兼容 的 。 而 且 ， 传 送信 息 的 电子 邮件 系统 
不 需要 理解 正文 或 MIME 头 部 行 所 使 用 的 编码 一 一 这 些 信息 可 以 完全 像 任 何 电 子 邮 件 信 息 
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一 样 对 待 。 邮 件 系统 传送 头 部 信息 而 不 解释 它们 ， 并 将 正文 像 单个 文本 块 一 样 对 待 。 
11.4 SMTP 协议 


从 11.2 节 的 介绍 知道 邮件 传送 代理 间 通 过 TCP 连 接 来 传输 邮件 信息 ， 但 TCP 连 接 只 提供 
了 一 个 可 靠 的 信息 通道 ， 邮 件 传 送 时 还 必须 处 理 许 多 细节 。 例 如 要 允许 发 送 方 询问 一 个 给 定 
的 邮箱 在 服务 器 所 在 的 计算 机 上 是 否 存在 ; 要 保证 邮件 可 靠 的 传递 一 一 发 送 方 必须 保存 一 个 
信息 的 副本 直到 接收 方 将 一 个 副本 放 至 不 易 丢 失 的 存储 器 〈 如 磁盘 ) 。 这 些 功能 不 在 TCP 的 
范畴 内 ， 因 此 需要 有 专门 的 协议 来 处 理 这 类 细节 。TCP/IP 协 议 族 提供 了 两 个 电子 邮件 传输 协 
i: MTP (Mail Transfer Protocol， 邮 件 传输 协议 ) 和 SMTP (Simple Mail Transfer Protocol, 
简单 邮件 传输 协议 ) 。 顾名思义 , 后 者 比 前 者 简单 。 但 简单 并 不 意味 着 功能 差 , 而 正 因为 SMTP 
协议 既 简单 又 具有 足够 的 功能 ， 从 而 得 到 广泛 的 应 用 。 目 前 ，Internet 上 的 绝 大 多 数 邮 件 服务 
器 均 使 用 SMTP 协 议 ， 因 此 本 节 主 要 介绍 SMTP 协 议 的 工作 过 程 和 主要 命令 。 


11.4.1 SMTP 命令 


SMTP 工作 时 是 通过 发 送 方 发 送 命令 ， 接 收 方 处 理 命令 后 返回 相应 的 应 答 ， 然 后 发 送 方 
再 根据 应 答 发 送 新 的 命令 再 接收 应 答 ， 这 样 一 种 经 过 多 轮 命令 -应 答 的 交互 来 完成 邮件 传输 
的 。SMTP 定义 了 14 个 命令 ， 它 们 是 : 


HELO <SP> <domain> <CRLF> 

MAIL <SP> FROM:<reverse-path> <CRLF> 
RCPT <SP> TO:<forward-path> <CRLF> 
DATA <CRLF> 

RSET <CRLF> 

SEND <SP> FROM:<reverse-path> <CRLF> 
SOML <SP> FROM:<reverse-path> <CRLF> 
SAML <SP> FROM:<reverse-path> <CRLF> 
VRFY <SP> <string> <CRLF> 

EXPN <SP> <string> <CRLF> 

HELP [<SP> <string>] <CRLF> 

NOOP <CRLF> 

QUIT <CRLF> 

TURN <CRLF> 


其 中 使 得 SMTP 工作 的 基本 的 命令 有 8 个 ， 分 别 为 : HELO. MAIL, RCPT. DATA, 
RSET, NOOP, QUIT 和 VRFY， 下 面 分 别 介 绍 。 

(D HELO 一 一 发 件 方 问候 收 件 方 ， 后 面 是 发 件 人 的 服务 器 地 址 或 标识 。 收 件 方 回答 
OK 时 标识 自己 的 身份 。 问 候 和 确认 过 程 表明 两 台 机 器 可 以 进行 通信 ， 同 时 状态 参量 被 复位 ， 
缓冲 区 被 清空 。 

(2) MAIL 一 一 这 个 命令 用 来 开始 传送 邮件 ， 它 的 后 面 跟随 发 件 方 邮 件 地 址 〈 返 回 邮件 
地 址 ) 。 它 也 用 来 当 邮件 无 法 送 达 时 ， 发 送 失败 通知 。 为 保证 邮件 的 成 功 发 送 ， 发 件 方 的 地 
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址 应 是 被 对 方 或 中 间 转 发 方 同 意 接受 的 。 这 个 命令 会 清空 有 关 的 缓冲 区 , 为 新 的 邮件 做 准备 。 

(3) RCPT 一 一 这 个 命令 告诉 收 件 方 收 件 人 的 邮箱 。 当 有 多 个 收 件 人 时 ， 需 要 多 次 使 用 该 
命令 ， 每 次 只 能 指明 一 个 人 。 如 果 接 收 方 服务 器 不 同意 转发 这 个 地 址 的 邮件 ， 它 必须 报 550 
错误 代码 通知 发 件 方 。 如 果 服 务 器 同意 转发 , 它 要 更 改 邮 件 发 送 路 径 , 把 最 开始 的 目的 地 (该 
服务 器 ) 换 成 下 一 个 服务 器 。 

(4)DATA 一 一 收 件 方 把 该 命令 之 后 的 数据 作为 发 送 的 数据 。 数 据 被 加 入 数据 缓冲 区 中 ， 
以 单独 一 行 是 "<CRLF>.<CRLF>" 的 行 结束 数据 。 结 束 行 对 于 接收 方 同时 意味 立即 开始 缓冲 区 
内 的 数据 传送 ， 传 送 结束 后 清空 缓冲 区 。 如 果 传 送 接受 ， 接 收 方 回复 OK。 

(5) REST 一 一 这 个 命令 用 来 通知 收 件 方 复 位 ， 所 有 已 存 入 缓冲 区 的 收 件 人 数据 、 发 件 
人 数据 和 待 传送 的 数据 都 必须 清除 ， 接 收 方 必须 回答 OK. 

(6) NOOP 一 一 这 个 命令 不 影响 任何 参数 ， 只 是 要 求 接收 方 回 答 OK， 不 会 影响 缓冲 
的 数据 。 

CD QUIT 一 一 SMTP 要 求 接收 方 必须 回答 OK， 然 后 中 断 传输 ， 在 收 到 这 个 命令 并 回 
答 OK 前 ， 收 件 方 不 得 中 断 连接 ， 即 使 传输 出 现 错误 。 发 件 方 在 发 出 这 个 命令 并 收 到 OK 答 
复 前 ， 也 不 得 中 断 连 接 。 

(8) VRFY 一 一 该 命令 使 客户 能 够 询问 发 送 方 以 验证 接收 方 地 址 , 而 无 需 向 接收 方 发 送 邮 
件 。 通 常 是 系统 管理 员 在 查找 邮件 交付 差错 时 手工 使 用 的 。 

接收 方 服务 器 处 理 完 命令 后 返回 的 应 答 信息 为 了 与 命令 区 别 开 来 采用 了 数字 序列 。 表 
11.2 给 出 了 SMTP 应 答 中 用 到 的 代码 及 其 含义 。 


Pl 


X112 SMTPÈZRE 


代 码 含 X 
500 Syntax error, command unrecognized 
501 Syntax error in parameters or arguments 
502 Command not implemented 
503 Bad sequence of commands 
504 Command parameter not implemented 
211 System status, or system help reply 
214 Help message 
220 <domain> Service ready 
221 <domain> Service closing transmission channel 
421 <domain> Service not available, closing transmission channel 
250 Requested mail action okay, completed 
251 User not local: will forward to <forward-path> 
450 Requested mail action not taken: mailbox unavailable 
550 Requested action not taken: mailbox unavailable 
451 Requested action aborted: error in processing 
551 User not local: please try <forward-path> 
452 Requested action not taken: insufficient system storage 
552 Requested mail action aborted: exceeded storage allocation 
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续 表 


代 u = x 


553 | Requested action not taken: mailbox name not allowed 
354 Start mail input; end with <CRLF>.<CRLF> 
554 Transaction failed 


11.4.2 SMTP 工作 过 程 


下 面 以 RFC821 中 的 一 个 例子 来 进一步 说 明 SMTP 协议 的 工作 过 程 。 
假设 在 Alpha.ARPA 主机 的 Smith 发 送 邮件 给 Beta ARPA 主机 的 Jones, Green 和 Brown 
的 ， 这 里 假定 主机 Alpha 与 主机 Beta 直接 相连 。 此 时 ，SMTP 协议 的 工作 过 程 如 图 11.3 所 示 。 
发 送 方 接收 方 


MAIL FROM:<Smith@Alpha.ARPA> 


RCPT TO:<Jones@Beta.ARPA> 


RCPT TO:<Green@Beta.ARPA> 


RCPT TO:<Brown@Beta.ARPA> 


DATA 


| 


Blah Blah Blah ... 


<CRLF>.<CRLF> 


250 OK 


11.3 SMTP 工作 过 程 示例 


发 送 方 在 邮件 发 送 时 首先 发 送 Mail 命令 通知 接收 方 邮 件 发 送 者 的 地 址 ， 在 获取 肯定 答 
复 后 〈 应 答 230) ， 发 送 RCPT 命令 告知 接收 方 收 件 人 地 址 ; 在 本 例 中 收 件 人 Jones 和 Brown 
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存在 而 收 件 人 Green 不 在 主机 Beta E (EA 550) ， 当 发 送 方 得 知 有 存在 的 收 件 人 后 将 发 送 
DATA 命令 请 求 传送 数据 ， 对 此 命令 的 肯定 答复 是 354 并 以 <CRLF>.<CRLF> 结 束 ; 然后 开 
始 邮 件 的 传输 。 传 输 结 束 后 发 送 方 发 送 <CRLF>.<CRLF> 以 通知 接收 方 邮件 传送 结束 。 最 终 ， 
Jones 和 Brown 将 正确 接收 邮件 。 


11.5 邮箱 访问 


从 11.2 节 的 TCP/IP 邮件 系统 结构 可 知 ， 发 送 方 的 传送 代理 并 不 直接 对 接收 者 邮箱 进行 
存 取 ， 而 是 每 个 有 邮箱 的 计算 机 系统 必须 运行 一 个 邮件 服务 器 程序 来 接收 电子 邮件 并 将 它 放 
进 正确 的 邮箱 。 因 此 邮箱 通常 处 于 邮件 服务 器 所 在 的 机 器 上 。 若 在 用 户 本 地 计算 机 上 放置 邮 
箱 并 运行 邮件 服务 器 会 存在 下 述 一 些 问题 。 首先 , 一 般 用 户 使 用 的 PC 机 计算 存储 资源 有 限 ， 
可 能 难以 支撑 邮件 服务 器 的 运行 。 其次, 用 户 的 计算 机 一 般 没 有 固定 的 他 地 址 ， 即 使 有 也 不 
能 保证 全 天 24 小 时 的 开机 ， 显 然 一 台 在 一 些 时 间 里 (如 工作 时 间 之 外 〉 处 于 关闭 状态 或 是 
不 与 因特网 相连 的 计算 机 不 足以 作为 电子 邮件 接收 方 。 再 者 ， 即 使 用 户 的 机 器 上 述 条 件 都 满 
足 ， 将 邮箱 放 在 用 户 本 地 机 还 存在 如 下 不 便 。 即 用 户 可 能 需要 在 多 个 地 点 访问 邮箱 ， 比 如 将 
邮箱 放置 在 用 户 单位 的 机 器 上 ， 那 么 他 在 家 里 时 将 难以 访问 邮箱 。 因 此 用 户 一 般 使 用 的 邮箱 
是 由 因特网 服务 提供 商 或 用 户 所 在 单位 部 门 提供 的 ， 这些 邮件 服务 器 并 不 在 用 户 的 本 地 计算 
机 上 运行 。 这 就 需要 解决 用 户 如 何 访问 邮箱 的 问题 。 

TCP/IP 协议 包含 了 提供 对 电子 邮件 邮箱 进行 远程 存 取 的 协议 ,这些 协议 允许 用 户 的 邮箱 
安置 于 运行 邮件 服务 器 的 计算 机 上 ， 并 允许 用 户 从 另 一 台 计 算 机 对 邮箱 的 内 容 进 行 存 取 。 其 
中 使 用 最 为 广泛 的 是 邮局 协议 (Post Office Protocol, 简称 POP) ， 目 前 使 用 的 大 多 是 邮局 协 
议 第 三 版 ， 即 POP3。 


11.5.4 POP3 协议 


POP3 协议 在 工作 时 采用 客户 机 /服务 器 模式 .需要 在 邮箱 所 在 的 机 器 上 运行 POP 服务 器 ， 
用 户 运 行 的 电子 邮件 软件 成 为 该 POP 服务 器 的 客户 ， 对 邮箱 的 内 容 进 行 存 取 。 图 11.4 描述 
POP 协议 的 工作 模式 。 


邮件 服务 器 
邮件 发 送 代理 二 用 户 计算 机 
SMTP SMTP POP POP 
客户 服务 器 八 服务 器 客户 端 
TCP 连 接 TCP 连 接 


图 11.4 POP 协议 工作 模式 
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邮件 发 送 方 利用 邮件 传送 代理 与 邮件 服务 器 上 的 SMTP 服务 器 建立 连接 , 将 邮件 放 入 用 
户 邮箱 。 邮 件 服务 器 上 的 POP 服务 器 侦 听 TCP 的 110 端口 ， 用 户 在 访问 邮箱 时 用 户 的 邮件 
软件 作为 客户 端 与 POP 服务 器 建立 TCP 连接 ， 然 后 通过 交互 一 系列 的 命令 将 用 户 邮 箱 中 的 
邮件 下 载 到 用 户 本 地 计算 机 或 将 邮件 删除 。 这 里 命令 的 交互 过 程 与 SMTP 的 命令 交互 过 程 类 
Ws, WAAR. 


115.2 ”其 他 邮箱 访问 方式 


在 使 用 POP 协议 的 访问 邮箱 时 ,所 有 信息 都 下 载 到 客户 端 ,通常 是 与 服务 器 接 通 即 下 载 。 
随后 ， 所 有 进程 包括 读 取 、 删 除 、 存 储 ， 仅 在 客户 端 进行 。 这 种 访问 属于 脱 机 式 的 访问 。 当 
然 ， 信 息 也 可 用 脱 机 方式 创建 ， 之 后 通过 SMTP 上 载 到 服务 器 。 目 前 Internet 上 的 邮箱 访问 
除了 脱 机 方式 外 还 有 联机 方式 和 分 离 式 访问 。 

所 谓 联机 方式 是 通过 将 所 有 信息 回溯 至 主机 和 外 部 账号 进行 处 理 。 这 里 ， 客 户 端 用 户 在 
服务 器 上 操作 邮箱 数据 ， 通 过 会 话 保持 链接 。 客 户 端 在 本 地 不 保存 任何 邮件 信息 ， 只 是 在 需 
要 时 才 从 服务 器 检索 。 联 机 方式 的 邮箱 访问 一 般 采 用 HTTP 协议 ， 通 常 浏览 器 作为 邮箱 访问 
的 客户 端 ， 这 种 方式 又 称 作 webmail。 因 此 ， 若 不 连接 到 网 络 ， 就 不 能 对 邮件 实施 任何 操作 。 

分 离 式 访问 是 联机 模式 与 脱 机 模式 的 混合 方式 。 在 这 种 模式 下 ， 终 端 用 户 可 以 周期 性 地 
链接 到 服务 器 ， 如 在 家 中 通过 拨号 接 入 ， 下 载 信息 。 信 息 可 以 在 脱 机 状态 读 取 、 删 除 或 重组 。 
若 下 一 次 链接 到 来 ， 则 将 服务 器 中 刚才 正 被 访问 的 远程 信息 实施 同步 存储 。 其 结果 是 ， 分 离 
式 访问 用 户 可 以 像 联机 方式 那样 进行 存 取 。 分 离 式 访问 采用 IMAP 协议 (Internet Message 
Access Protocol) ，IMAP 提供 的 摘要 浏览 功能 可 以 让 用 户 在 阅读 完 所 有 的 邮件 到 达 时 间 、 主 
题 、 发 件 人 、 大 小 等 信息 后 才 作出 是 否 下 载 的 决定 。 也 就 是 说 ， 用 户 不 必 等 所 有 的 邮件 都 下 
载 完毕 后 才 知道 究竟 邮件 里 都 有 些 什么 。 同 时 IMAP 允许 用 户 在 服务 器 上 建立 任意 层次 结构 
的 文件 夹 ， 并 且 可 以 灵活 地 在 文件 夹 之 间 移 动 邮件 ， 随 心 所 欲 地 组 织 邮 箱 〈 这 些 显然 是 通过 
POP3 做 不 到 的 ) 。 

从 三 种 访问 方式 的 功能 来 看 , 分 离 式 访问 同时 具有 POP 方式 和 webmail 的 优点 , 功能 最 
为 强大 ， 使 用 方便 灵活 。 但 该 种 方式 占用 服务 器 资源 较 多 ， 需 要 较 多 的 技术 支撑 ， 因 此 采用 
该 种 方式 的 运营 商 较 少 。POP 方式 因 其 简单 且 使 用 也 较为 方便 而 得 到 广泛 的 使 用 。 
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最 初 设想 Internet 时 ， 设 计 者 的 着 眼 点 主要 在 于 通信 的 安全 性 和 可 靠 性 。 在 第 一 批 连接 
建立 之 后 不 久 , 人 们 很 快 就 发 现 , Internet 可 方便 地 用 于 信息 交流 和 项 目 协作 。 不 过 即使 如 此 ， 
创建 之 初 的 Internet 用 量 增长 缓慢 ， 主 要 停留 在 较 大 型 的 单位 和 大 学 中 。 造 成 这 一 局 面 的 主 
要 原因 是 Internet 上 最 初 开发 出 的 Telnet, FTP 等 应 用 本 身 不 适用 于 信息 的 发 布 和 交流 。 这 一 
局 面 随 着 WWW (World Wide Web) 技术 的 出 现 发 生 了 根本 地 改观 。 尤 其 是 1993 年 以 后 图 
形 WWW 浏览 器 的 开发 成 功 直接 导致 mternet 用 户 和 节点 的 指数 增长 。 图 12.1 显示 了 1994 
年 1 月 至 1995 年 3 月 份 间作 为 WWW 基础 的 HTTP 协议 分 组 在 整个 Internet 分 组 中 所 占 比 
例 的 增长 情况 。 WWW 之 所 以 能 受到 广泛 的 欢迎 是 因为 WWW 采用 了 图 形 用 户 界面 , 在 Web 
页 面 中 融合 了 文本 、 图 像 、 声 音 和 视频 等 多 种 信息 表达 方式 ， 同 时 其 中 的 超 链 接 允 许 用 户 只 
需 简单 的 单 击 操作 即 可 从 一 个 网 站 跳 转 至 另 一 个 网 站 ， 这 不 仅 极 大 方便 了 信息 的 发 布 也 大 大 
简化 了 用 户 对 信息 的 浏览 和 检索 。 
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121 WWW 在 1994 年 1 月 至 1995 年 3 月 间 的 增长 情况 
本 章 着 重 介 绍 构成 WWW 基础 的 HTTP 协议 , RE) HTTP 协议 必然 涉及 到 HTML 语言 ， 
因此 首先 简要 介绍 HTML 语言 , 然后 讨论 HTTP 协议 的 工作 模式 、 主 要 命令 以 及 HTTP 协议 
的 工作 过 程 。 


12.1 超 文 本 和 URL 


12.1.1. EXE 


WWW 作为 mtemet 上 信息 发 布 的 场所 其 本 质 上 可 看 作 是 信息 的 集合 。 而 这 些 信 息 是 以 
文档 形式 分 布 存放 在 Intenet 中 的 主机 上 。 那 么 如 何在 一 个 文档 中 组 织 这 些 分 散 存 放 的 信息 
We? 超 文本 概念 在 这 里 发 挥 了 很 大 作用 。 所 谓 超 文 本 文档 是 指 该 文档 中 除了 基本 的 信息 外 ， 
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文档 中 还 可 以 有 指向 信息 集合 中 其 他 文档 的 指针 。 超 文本 概念 提供 了 一 种 分 布 环境 下 组 织 数 
据 和 信息 的 机 制 。 其 实 超 文本 概念 并 不 是 Internet 时 代 才 出 现 的 ， 作 为 一 种 组 织 信息 的 手段 
在 20 世纪 60 年 代 即 由 斯 坦 福 研究 所 的 Ted Nelson 提出 ,CERN 小 组 继续 了 这 一 思想 在 1990 
年 提出 了 超 文本 标记 语言 HTML (HyperText Marked Language) ， 并 将 它 用 于 Internet 上 形 
成 最 初 的 WWW。 不 过 这 时 的 超 文本 几乎 是 名 副 其 实 的 超 文本 ， 是 在 文本 文档 的 基础 上 增加 
了 指向 其 他 文本 文档 的 指针 ， 并 未 引起 广泛 的 注意 ，1990 年 至 1992 年 之 间 WWW 增长 还 很 
缓慢 。 随 着 1993 年 支持 图 形 图 像 和 声音 等 信息 的 浏览 器 开发 成 功 WWW. 迎 来 了 空前 的 发 展 。 
此 时 的 超 文本 文档 中 不 仅 包 含 文本 信息 还 包含 了 图 形 、 图 像 和 声音 视频 等 指针 ， 实 际 上 已 发 
展 为 超 媒体 ， 不 过 习惯 上 仍 将 其 称 为 超 文本 。 


12.1.2 ”统一 资源 定位 URL 


超 文 本 中 一 个 关键 的 概念 是 指向 其 他 文档 的 指针 , 由 于 WWW 是 分 布 式 的 , 并 且 指 针 指 
向 的 文档 类 型 多 样 ， 这 给 如 何 描述 这 类 指针 带 来 了 一 定 的 困难 。 首 先 ， 指 针 必 须 标明 所 指向 
文档 的 存放 地 点 和 文档 名 ; 其 次 由 于 Intemet 上 有 各 种 各 样 的 应 用 ， 并 且 将 来 还 可 能 出 现 一 
些 新 的 应 用 ， 指 针 中 应 有 采用 哪 种 应 用 来 获取 所 指向 的 文档 ， 并 且 这 种 方法 应 对 将 来 出 现 的 
新 应 用 同样 有 效 。 为 此 人 们 发 明了 一 种 语法 格式 ， 用 来 组 织 描述 远程 项 的 各 种 信息 。 该 语法 
把 信息 编码 成 一 个 字符 串 ， 称 为 统一 资源 定位 (Uniform Resource Locator; URL) 。URL 的 
protocol: //computer name: port/document name 
URL 被 冒号 和 斜 杠 符 分 隔 成 三 个 部 分 : 协议 ， 计 算 机 名 与 文档 名 。 其 中 protocol 是 访问 
文档 所 采用 应 用 所 用 的 协议 名 ，computer_name 是 文档 所 在 计算 机 的 域名 ， 计 算 机 名 后 的 冒 
号 表示 port 一 一 协议 端口 号 是 可 选项 〈 由 于 可 选 端口 号 很 少 使 用 ， 在 以 下 的 讨论 中 将 忽略 
此 项 ) ; document name 是 在 指定 计算 机 上 的 文档 名 ， 包 括 路 径 和 文件 名 。 例 如 ，URL: 
http:/ / www.seu.edu.cn/cs/index.html 
指明 协议 为 http， 计 算 机 名 为 www.seu.edu.cn， 文 件 cs/ index.html. 


12.2 HTML 简介 


12.2.1” 超 文本 文档 结构 


超 文本 文档 是 ASCI 字符 文件 ,但 不 同 于 一 般 的 文本 文件 ， 它 是 格式 化 的 文件 。 其 格式 
是 由 HIML 语言 来 定义 描述 的 HTML 语言 定义 了 超 文本 文档 的 结构 , 描述 了 文档 各 部 分 在 
浏览 器 中 处 理 时 的 相关 信息 (但 不 指定 浏览 器 如 何 格式 化 文档 ) 。HTML 语言 是 通过 定义 一 
系列 的 标签 来 实现 这 些 功能 的 。 

每 个 HTML 文档 分 为 两 个 主要 部 分 : 头 部 后 紧 跟着 主体 。 头 部 包含 了 文档 的 细节 ， 而 主 
体 则 包含 了 大 部 分 信息 。 例 如 ， 头 部 包含 了 文档 的 标题 一 一 大 多 数 的 浏览 器 用 标题 作为 标签 
来 让 用 户 知道 哪 一 网 页 正在 被 浏览 。 在 语句 构成 上 , 每 个 HTML 文档 以 一 个 包含 标签 和 其 他 
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信息 的 文本 文件 来 表示 。 在 大 多 数 的 编程 语言 中 ， 可 以 在 文档 中 插入 空白 字符 (例如 空 行 与 
空格 字符 ) 增加 源 程 序 的 可 读 性 ， 那 些 空白 字符 对 于 浏览 器 所 显示 的 格式 版 本 毫 无 影响 。 
HTML 标签 为 文档 提供 结构 提示 和 格式 提示 。 一 些 标签 指定 一 个 立即 生效 的 动作 〈 例 如 在 显 
示 屏 上 移动 到 一 个 新 行 ) ， 标 签 被 置 于 动作 应 该 出 现 的 地 方 。 其 他 的 标签 被 用 于 指定 一 个 适 
用 于 紧 跟 在 标签 之 后 的 所 有 文本 的 格式 操作 。 这 些 标签 成 双 出 现 ， 其 中 开始 标签 和 结束 标签 
分 别 启动 和 结束 动作 。 标 签 被 用 于 指定 一 个 立即 动作 或 者 启动 一 个 以 小 于 和 大 于 符号 括 起 来 
的 标签 名 形式 出 现 的 格式 动作 (尽管 标签 名 不 区 分 大 小 写 ， 但 是 按照 惯例 以 大 写 来 表示 〉。 

<TAGNAME> 

相应 的 用 于 结束 的 标签 以 两 个 连续 的 小 于 符 和 斜 杠 符 开始 ， 并 且 以 一 个 大 于 符 结束 : 

</TAGNAME> 

filii, HTML 文档 以 标签 <UHTML> 开 始 。 标 签 <HEAD> 与 </HEAD > 包括 了 头 部 ， 而 标 


签 <BODY > 与 </BODY> 包 括 了 主体 部 分 。 在 头 部 ， 标 签 <TITLE> 与 </TITLE> 包 括 了 形成 标 
题 的 文本 。 图 12.2 举例 说 明了 HTML 文档 的 一 般 形 式 。 


图 12.2 HTML 文档 的 一 般 形 式 


图 中 每 个 标签 都 出 现在 一 个 新 行 上 ， 并 且 以 行 首 缩 进来 显示 结构 。 不 过 ， 这 种 惯例 只 是 
为 了 方便 对 文档 的 阅读 ， 就 如 采用 缩 进 格式 缩写 的 C 语言 程序 一 样 ， 其 中 的 空格 不 会 影响 页 
面 在 浏览 器 中 的 显示 。 这 也 是 HTML 文档 和 文本 文档 不 同 的 地 方 , HTML 文档 的 显示 格式 是 
由 文档 中 的 标签 定义 的 。 


12.2.2 HTML 中 常用 标签 


从 上 面 的 介绍 可 知 ， 一 般 标签 是 成 对 出 现 的 ， 将 <tag> 和 </tag> 的 组 合 再 加 上 它们 中 间 的 
内 容 称 为 网 页 的 元 素 。 这 些 元 素 在 浏览 器 中 的 处 理 是 由 其 中 的 标签 来 决定 的 。 下 面 将 介绍 
HTML 文档 中 常见 的 标签 。 

1. <HTML> 和 </HTML> 标 签 

这 对 标签 用 来 表示 HTML 文档 的 开始 和 结束 ,其 作用 是 通知 浏览 器 它 所 处 理 的 是 HTML 
文档 。 实 际 上 ,可 以 把 HTML 格式 看 作 是 一 个 有 卷心菜 结构 的 文档 。 也 就 是 说 它 具 有 一 个 连 
续 的 表层 。 其 最 外 层 即 是 以 <HTML> 和 </HITML> 标 记 的 ， 所 有 其 他 的 元 素 均 包含 在 这 个 主要 
的 HTML 元 素 内 部 。 
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2. <HEAD> 和 </HEAD> 标 签 
一 个 HTML 文档 由 头 部 和 主体 构成 。 文 档 的 头 部 是 由 标签 <HEAD> 和 </HEAD> 标 出 。 
Coa) 头 部 一 般 包含 了 文档 的 标题 和 索引 等 文档 的 背景 信息 。 
3. HEAD 元 素 
在 文档 <HEAD> 层 内 的 网 页 元 素 称 为 HEAD 元素。 HEAD 元 素 主要 用 以 标识 文档 的 题目 
和 一 些 索引 之 类 的 背景 信息 。Web 浏览 器 并 不 显示 HEAD 元 素 的 内 容 ， 所 以 在 浏览 Web 页 
时 是 看 不 到 的 。 表 12.1 列 出 了 基本 的 HEAD 元 素 。 


表 12.1 基本 的 HEAD 元 素 


x X d xk 
TITLE 用 于 Web 页 的 跟踪 /访问 
BASE 在 Web 页 中 标识 文档 的 URL 地 址 (统一 资源 定位 ) 
ISINDEX 通知 Web 浏览 器 该 文档 可 被 搜寻 
LINK 描述 文档 和 其 他 文档 之 间 的 链接 
*Href 标识 其 他 的 文档 链接 
*Name 为 链接 取 名 
*Rel 描述 与 其 他 文档 的 关系 
*Rev 描述 与 其 他 文档 的 关系 
*Um 统一 资源 名 称 
*Methods 其 他 文档 所 支持 的 HTTP 方法 
META Meta 信息 
*Http-*quiv 将 META 元素 与 一 个 协议 连接 起 来 
*Name 将 内 容 命名 
*Content 将 文档 中 的 信息 分 类 
NEXTID 识别 代码 
*N 定义 下 一 个 识别 代码 

(1) TITLE 


TITLE 元 素 可 以 帮助 用 户 表示 和 跟踪 Web 页 。 通 常会 在 Web 浏览 器 的 标题 栏 〈 但 不 在 
Web 页 本 身 ) 中 显示 定义 的 标题 。 它 必须 少 于 50 个 字符 ， 并 且 不 能 包含 其 他 HTML 元 素 或 
属性 。 格 式 为 : 


<TITLE> 字 符 串 </TITLE> 


(2) BASE 
BASE 元 素 标识 了 在 Web 页 中 使 用 的 其 他 文档 的 URL 地 址 。 如 果 一 个 文档 被 移 开 了 它 
原来 所 在 的 位 置 ， 就 可 以 指明 它 最 初 的 来 源 。 这 将 使 得 超 文本 链接 的 装 入 更 加 精确 。BASE 
元 素 有 一 个 属性 ， 就 是 用 来 标识 其 他 资源 的 URL 的 Href。 例 如 : 


<BASE Href="http//www.sina.com"> 


(3) ISINDEX 
ISINDEX 元 素 用 来 通知 Web 浏览 器 在 BASE 元 素 中 列 出 的 文档 是 可 被 搜寻 的 ， 例 如 ， 


第 12 章 HITP 协 议 


将 该 标记 和 HEAD 标记 联合 起 来 使 用 便 可 允许 搜寻 整个 文档 , 该 文件 所 在 的 服务 器 必须 能 够 
支持 搜寻 。 
(4) LINK 
LINK 元 素 给 出 了 当前 的 文档 和 其 他 文档 或 对 象 之 间 的 关系 的 详细 描述 。 例 如 : 


<LINK Href="my_info.htm"> 


LINK 元 素 有 下 述 一 些 属性 : 

O Href: 给 出 了 该 连接 所 描述 的 文档 的 名 字 。 

O Name: 将 链接 命名 以 使 它 可 以 作为 一 个 可 能 的 超 文本 目标 来 使 用 。 

O Rel: 描述 由 链接 所 定义 的 关系 。 例 如 ，Rel=“made” 的 意思 是 ， 在 Href 中 给 定 的 

URL 是 文档 的 作者 。 
O Rev: 与 Rel 描述 的 关系 恰好 相反 。 例 如 ，Rev=“made” 的 意思 是 ， 当 前 的 文档 是 
Href 中 所 给 定 的 URL 的 作者 。 

O Um: 表明 该 文档 的 Uniform Resource Name (统一 资源 名 称 )。 

4. <BODY> 和 </BODY> 标 签 

<BODY> 和 </BODY> 标 签 中 所 包含 的 文档 的 主体 部 分 。BODY 中 的 元 素 是 Web 浏览 器 
将 要 进行 显示 的 那 一 部 分 内 容 , HI BODY 中 元 素 将 影响 文档 的 外 观 和 式样 。 BODY 部 分 可 以 
包含 文字 、 图 形 图 像 、 表 格 等 元 素 。 

由 于 HTML 文档 存储 在 文本 文件 中 , 所 以 文档 必须 包含 明确 的 标签 来 说 明 输 出 是 如 何 显 
示 的 。 例如: <BR> 标 签 指导 浏览 器 引入 一 个 行 分 隔 符 。 也 就 是 说 ， 当 在 输入 中 遇 上 <BR> 时 ， 
浏览 器 在 产生 更 多 的 输出 前 在 显示 屏 上 移动 到 下 一 行 的 行 首 。<p> 和 </p> 标 签 用 以 标记 一 个 
段落 元 素 。 它 允许 在 Web 页 中 创建 文字 块 。 而 <LI 是 一 个 列表 元 素 。 它 标记 着 列表 中 每 个 
项 目的 开始 。 

Web 文档 中 还 可 以 包含 非 文 本 信息 。 通常， 非 文 本 的 信息 诸如 图 形 或 者 数字 相片 等 并 不 
直接 插入 于 文档 之 中 。 数 据 位 于 一 个 独立 的 地 点 ， 而 文档 包含 了 指向 数据 的 引用 。 当 浏览 器 
遇 上 这 些 引 用 时 ， 浏 览 器 去 指定 地 点 取得 图 像 ， 并 且 将 图 像 插入 到 所 显示 的 文档 中 。 例 如 ， 
<IMG> 标 签 用 来 标记 HTML 文档 引用 的 外 部 图 像 。 如 ，<IMG Src=“PHOTO.jpg”> 表 明文 
件 “PHOTO.jpg” 包 含 一 个 浏览 器 所 要 插入 到 文档 中 的 图 像 。 其 中 IMG 的 Sre 属性 指明 了 图 
像 的 来 源 。 

除了 上 面 简单 介绍 的 这 些 标签 外 , HTML 语言 还 定义 足够 的 标签 用 于 显示 格式 的 控制 , 文 
档 显 示 的 背景 控制 等 ， 这 里 不 再 一 一 介绍 ， 有 兴趣 的 读者 可 以 参阅 HTML 方面 的 相关 文献 。 


12.3 HTTP 协议 概述 


超 文本 传送 协议 (HyperText Transfer Protocol, HTTP 协议 ) 是 Web 服务 器 用 来 处 理 服 
务 器 和 客户 机 之 间 的 数据 流 的 协议 。HTTP 协议 和 HTML 语言 构成 了 WWW 的 技术 基础 。 
HTTP 是 一 个 属于 应 用 层 的 面向 对 象 的 协议 ， 由 于 其 简捷 、 快 速 的 方式 ， 适 用 于 分 布 式 超 媒 
体 信 息 系统 。 它 于 1990 年 提出 ， 经 过 几 年 的 使 用 与 发 展 ， 得 到 不 断 地 完善 和 扩展 。 目 前 在 
WWW 中 使 用 的 是 HTTP/1.0 的 第 6 版 ,HTTP/1.1 的 规范 化 工作 正在 进行 之 中 ,而 且 HTTP-NG 
(Next Generation of HTTP) 的 建议 已 经 提出 。 
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12.3.1 HTTP 协议 的 工作 模式 


HTTP 协议 是 一 个 简单 的 协议 ， 与 其 他 Intemet 上 的 应 用 协议 类 似 ，HTTP 协议 是 基于 请 
求 /响应 模式 的 。 为 此 HTTP 协议 定义 了 一 组 消息 , 这 些 消息 分 为 两 种 类 型 : 来 自 客户 机 的 “请 
求 ”消息 和 来 自 服务 器 的 “应 答 ” 消 息 。HTTP 协议 在 工作 时 Web 浏览 器 通常 充当 客户 端的 
角色 ， 当 用 户 向 浏览 器 提交 命令 后 ， 浏 览 器 将 打开 与 远 端 服务 器 TCP 连接 的 80 端口 (80 端 
口 是 HTTP 协议 的 默认 端口 ， 当 然 采 用 其 他 端口 的 HTTP 服务 器 也 是 存在 的 ) ， 然 后 在 此 连 
接 上 发 送 相应 的 请 求 命令 。 服 务 器 在 收 到 请 求 命令 对 其 做 出 相应 处 理 后 将 处 理 的 结果 以 应 答 
消息 返回 到 客户 端 并 关闭 此 次 TCP 连接 。 其 工作 过 程 如 图 12.3 所 示 。 


用 户 代 理 (UA) 源 服务 器 (0) 
响应 链 


图 12.3 HTTP 协议 的 工作 过 程 


12.3.2 HTTP 协议 特点 


从 上 述 HTTP 协议 的 工作 模式 可 以 看 出 HTTP 协议 具有 如 下 主要 特点 

(1) 支持 客户 /服务 器 模式 。 

(2) 简单 快速 : 客户 向 服务 器 请 求 服务 时 ， 只 需 传送 请 求 方法 和 路 径 。 请 求 方法 常用 
的 有 GET. HEAD. POST. 每 种 方法 规定 了 客户 与 服务 器 联系 的 类 型 不 同 。 由 于 HTTP 协议 
简单 ， 使 得 HTTP 服务 器 的 程序 规模 小 ， 因 而 通信 速度 很 快 。 

G) 灵活 : HTTP 允许 传输 任意 类 型 的 数据 对 象 。 正 在 传输 的 类 型 由 Content-Type 加 以 
标记 。 

(4) 无 连接 : 无 连接 的 含义 是 限制 每 次 连接 只 处 理 一 个 请 求 。 服 务 器 处 理 完 客户 的 请 
求 ， 并 收 到 客户 的 应 答 后 ， 即 断 开 连 接 。 采 用 这 种 方式 可 以 节省 传输 时 间 。 

(5) 无 状态 : HITP 协议 是 无 状态 协议 。 无 状态 是 指 协议 对 于 事务 处 理 没有 记忆 能 力 。 
缺少 状态 意味 着 如 果 后 续 处 理 需 要 前 面 的 信息 ， 则 它 必须 重 传 ， 这 样 可 能 导致 每 次 连接 传送 
的 数据 量 增 大 。 另 一 方面 ， 在 服务 器 不 需要 先前 信息 时 它 的 应 答 就 较 快 。 


12.4 HTTP 请 求 和 应 答 


124.1 请求 消 息 
请 求 消息 由 客户 机 发 送 给 服务 器 以 请 求 数据 。 典 型 的 HTTP 请 求 消息 格式 如 下 : 
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request-line (<method> URI <HTTP-version>) 
headers 
<blank line> 
<body> 


其 中 第 一 行 是 请 求 行 ，method 是 客户 发 送 的 具体 的 请 求 方法 ，URI (Uniform Resource 
Identifier, URI) 是 所 请 求 页 面 的 统一 资源 标识 ， 最 后 部 分 是 客户 端 所 用 的 HTTP 协议 的 版 
本 信息 。 请 求 行 和 随后 的 首部 信息 (headers) 构成 请 求 消息 的 报 文 头 ， 报 文 头 和 报 文 主体 以 
空 行 分 割 开 。 首 部 信息 可 以 包含 0 个 或 多 个 字段 。 

HTTP/1.0 支持 三 个 请 求 方法 : 

(1) GET 请 求 ， 返 回 请 求 行 中 URI 所 指出 的 页 面 信息 。 

(2) HEAD 请 求 ， 类 似 于 GET 请 求 ， 但 服务 器 程序 只 返回 URI 指定 文档 的 首部 信息 ， 
而 不 包含 实际 的 文档 内 容 。 该 请 求 通常 被 用 来 测试 超 文 本 链接 的 正确 性 、 可 访问 性 和 最 近 的 
修改 。GET 和 HEAD 请 求 报 文 不 带 报 文 主体 。 

(3) POST 请 求 用 来 发 送 电子 邮件 、 新 闻 或 发 送 能 由 交互 用 户 填写 的 表格 。 这 是 惟一 需 
要 在 请 求 中 发 送 body 的 请 求 。 使 用 POST 请 求 时 需要 在 报 文 首 部 Content-Length 字段 中 指出 
body 的 长 度 。 


124.2 应答 消息 
服务 器 以 如 下 方式 向 客户 机 发 送 一 个 应 答 : 


status-line (<HTTP-version> response-code response-phrase) 
headers 

<blank line> 

<body> 


应 答 消息 的 格式 与 请 求 消息 类 似 ， 分 为 消息 头 和 主体 两 部 分 ， 中 间 以 一 空白 行 隔 开 。 应 
答 的 第 一 部 分 是 应 答 头 。 它 以 一 个 状态 行 开 始 ， 状 态 行 包 括 所 用 的 HTTP 版 本 、 一 个 状态 编 
f CX 12.2 给 出 各 种 状态 编码 及 其 含义 ) 和 一 个 原因 短语 。 跟 随 在 状态 行 之 后 的 是 描述 应 答 
细节 的 一 系列 格式 化 首部 字段 。 跟 随 在 应 答 头 后 的 空白 行 说 明 应 答 头 已 结束 。 如 果 有 与 应 答 
有 关 的 数据 体 ， 它 将 跟随 在 空白 行 后 ， 即 上 面 的 body 部 分 。 


表 12.2 HTTP 应 答 状 态 编码 

Ks 码 
信息 Onformationa) 1xx 
HTTP/L0 中 为 定义 
成 功 (Successful) 2xx 
200 
201 
202 
204 


原因 短语 


正确 (OK) 

创建 (Created) 
接收 (Accepted) 

无 内 容 (No Content) 


Qo) 
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Ks 码 

重 定 向 (Redirection) 3xx 

300 

301 

302 

304 

客户 机 错误 (Client Error) 4xx 
400 

401 

403 

404 

服务 器 错误 (Server Error) 5xx 
500 

501 

502 

503 


原因 短语 


多 种 选择 (Multiple Choices) 
永久 移动 (Moved Permanently) 
暂时 移动 (Moved Temporarily) 
未 被 修改 (Not Modified) 


错误 请 求 (Bad Choice) 
未 授权 (Unauthorized) 
禁止 (Forbidden) 

未 发 现 (Not Found) 


内 部 服务 器 错误 CInternal Server Error) 
未 实现 (Not Implemented ) 
错误 网 关 (Bad Gateway) 

服务 未 提供 (Service Unavailable) 


124.3 ”首部 字段 


首部 字段 又 称 为 元 信息 , 即 关 于 信息 的 信息 。 利用 元 信息 可 以 实现 有 条 件 的 请 求 或 应 答 。 
请 求 消息 中 的 首部 字段 告诉 服务 器 怎样 解释 本 次 请 求 ， 主 要 包括 用 户 可 以 接受 的 数据 类 型 、 
压缩 方法 和 语言 等 。 而 应 答 消息 中 的 首部 字段 主要 包括 实体 信息 类 型 、 长 度 、 压 缩 方法 、 最 
后 一 次 修改 时 间 、 数 据 有 效 期 等 。 常 见 的 首部 字段 如 表 12.3 所 示 。 


R123 ”常见 首部 字段 表 


首部 名 称 请 求 | 应 答 
Allow 主体 所 允许 的 方法 


Authorization 客户 授权 信息 


| | | 
|e | | 

Content-Encoding 主体 所 用 的 编码 

Content-Length 主体 长 度 

Content-Type 主体 类 型 

Date 客户 或 服务 器 的 时 间 

Expires 主体 的 有 效 期 

From 请 求 发 送 者 的 E-mail 

If-Modified-Since 某 时间 前 网 页 是 否 更 改 


Last-Modified 最 后 更 改 的 时 间 

Location 请 求 页 重 定向 后 的 位 置 
Pragma 客户 机 或 服务 器 实现 细节 
Referer 客户 获取 所 请 求 URI 的 URI 


Server 服务 器 信息 
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首部 名 称 $& xX 
User-Agent 客户 机 信息 
WWW-Authenticate 服务 器 要 求 授权 信息 
Access Authentication 授权 信息 


一 个 首部 字段 由 字段 名 和 随后 的 冒号 、 一 个 空格 和 字段 值 组 成 ， 字 段 名 不 区 分 大 小 写 。 
首部 字段 可 分 为 三 类 : 一 类 应 用 于 请 求 ， 一 类 应 用 于 响应 ， 还 有 一 类 描述 主体 。 有 一 些 报 文 
头 〈 例 如 : Date) 既 可 用 于 请 求 又 可 用 于 响应 。 描 述 主体 的 首部 字段 可 以 出 现在 POST 请 求 
和 所 有 响应 报 文中 。 


12.5 浏 览 器 


WWW 是 一 个 分 布 式 的 超 媒体 系统 ， 在 WWW 上 发 布 的 信息 有 文本 、 图 像 、 图 形 、 音 
频 和 视频 等 各 种 格式 。Web 浏览 器 作为 WWW 的 客户 应 用 程序 不 仅 要 能 完成 HTTP 的 通信 ， 
更 重要 的 是 要 能 处 理 各 种 格式 的 信息 。 事 实 上 如 前 所 述 ，HTML 语言 和 HTTP 协议 在 1990 
年 就 已 出 现 ， 但 直到 1993 年 图 形 化 的 Web 浏览 器 出 现 后 WWW 才 迎 来 高 速 地 增长 。 

Web 浏览 器 具有 一 个 比 Web 服务 器 更 为 复杂 的 结构 。 服 务 器 重复 地 执行 一 个 简单 的 任 
务 : 等 待 浏览 器 打开 一 个 连接 并 且 请 求 一 个 指定 的 网 页 。 随 后 服务 器 发 送 所 请 求 的 项 ， 关 闭 
连接 并 且 等 待 下 一 次 的 连接 。 浏 览 器 则 需要 处 理 文档 的 细节 并 进行 显示 。 浏 览 器 包含 几 个 大 
型 的 软件 组 件 ， 它 们 一 起 工作 从 而 提供 一 个 无 颖 服务 。 图 12.4 说 明了 浏览 器 概念 上 的 组 织 。 


图 12.4 浏览 器 组 织 结构 图 


从 概念 上 讲 ， 浏 览 器 由 一 组 客户 、 一 组 解释 器 和 一 个 管理 它们 的 控制 器 所 组 成 。 控 制 器 
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形成 了 浏览 器 的 中 心 部 件 ， 它 控制 鼠标 单 击 与 键盘 输入 ， 并 且 调 用 其 他 组 件 来 执行 用 户 指定 
的 操作 。 例 如 ， 当 用 户 输入 一 个 URL 或 者 单 击 一 个 超 文 本 引用 时 ， 控 制 器 调用 一 个 客户 从 
所 需 文 档 所 在 的 远程 服务 器 上 取 回 该 文档 ， 并 且 调 用 解释 器 向 用 户 显示 该 文档 。 

每 个 解释 器 必须 包含 一 个 HTML 解释 器 来 显示 文档 。 其 他 的 解释 器 是 可 选 的 。HTML 
解释 器 的 输入 由 符合 HTML 语法 的 文档 所 组 成 ， 输 出 由 位 于 用 户 显示 器 上 的 格式 化 文档 组 
Jk. 解释 器 通过 将 HTML 规格 转换 成 适合 用 户 显示 硬件 的 命令 来 处 理 版 面 细节 。 例 如， 如 果 
碰 到 文档 的 头 部 标签 ， 解 释 器 则 改变 用 于 显示 头 部 的 文本 大 小 。 同 样 ， 如 果 碰 到 一 个 断 行 标 
签 ， 解 释 器 则 输出 一 个 新 行 。 

HTML 解释 器 一 个 最 重要 的 功能 是 可 包含 可 选项 。 解 释 器 必须 存储 关于 显示 器 上 位 置 之 
间 关 系 的 信息 和 HTML 文档 中 被 锚 定 的 项 。 当 用 户 用 鼠标 选择 了 一 个 项 时 , 浏览 器 通过 当前 
的 光标 位 置 和 存储 的 位 置信 息 来 决定 哪个 项 被 用 户 选中 。 

浏览 器 这 种 将 控制 器 、 客 户 组 件 和 解释 器 分 开 的 设计 提供 了 很 好 的 灵活 性 。WWW 作为 
超 媒 体系 统 包含 了 各 种 各 样 的 媒体 ， 同 时 随 着 技术 的 进步 新 技术 新 应 用 会 不 断 地 涌现 ， 浏 览 
器 的 这 种 面向 对 象 的 设计 可 以 方便 的 通过 增加 插件 的 方式 升级 现 有 的 浏览 器 ， 同 时 也 给 用 户 
以 定制 浏览 器 功能 的 余地 。 
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TCP/IP 的 一 个 重要 应 用 就 是 用 于 不 同 主机 系统 间 的 数据 (文件) 共享 。 访 问 远程 数据 的 
方法 主要 有 两 种 形式 : 整体 文件 复制 和 实时 在 线 共享 。 常 见 的 用 于 文件 共享 的 应 用 协议 有 三 
Th: 文件 传输 协议 FTP 是 TCP/IP 协议 族 中 主要 的 文件 传输 协议 ， 它 使 用 整体 文件 复制 向 用 
户 提 供 了 浏览 远程 文件 服务 器 文件 目录 以 及 双向 传送 文件 的 能 力 。 轻 量 级 文件 传输 协议 
TFTP 向 那些 只 需要 文件 传输 的 应 用 提供 了 一 种 简单 小 巧 的 FTP 替换 方案 。 因 为 它 可 以 小 到 
存放 在 ROM Œ, TFTP 可 以 被 用 来 启动 无 驱 主 机 。 网 络 文件 系统 NFS 是 由 SUN HABA A 
设计 用 来 提供 实时 在 线 文件 共享 的 应 用 协议 ， 它 使 用 UDP 来 进行 消息 传送 并 实现 SUN 的 远 
程 过 程 调用 (RPC) 机 制 和 扩展 数据 格式 表示 (XDR) 机 制 。 因 为 RPC 和 XDR 是 和 NFS 独 
立定 义 的 ， 程 序 员 可 以 使 用 它们 来 构建 分 布 式 应 用 程序 。 本 章 分 别 介绍 这 三 种 协议 。 


13.1 FTP 文件 传输 协议 


13.1.1 简介 


FTP 协议 位 于 OSI 网 络 七 层 模型 的 应 用 层 ， 同 时 也 是 TCP/IP 协议 族 的 一 部 分 。 本 节 将 
主要 介绍 FTP 协议 的 设计 思想 、 工 作 原 理 并 提供 一 个 典型 的 用 户 交 互 的 样 例 加 以 说 明 。 读 者 
在 通读 本 章 后 将 会 发 现 FTP 协议 作为 一 个 广泛 使 用 的 文件 传输 协议 其 实 是 构建 在 TCP 协议 
和 Telnet 协议 之 上 的 。 

FTP 协议 的 原始 设计 目标 有 4 个: (1) 促进 文件 (包括 程序 和 数据 ) 的 共享 ，(2) 鼓 
励 间接 地 或 隐 式 地 (通过 程序 ) 来 使 用 远程 计算 机 ; G) 使 得 不 同 主机 的 不 同文 件 存储 系 
统 对 用 户 来 讲 是 透明 的 ，〈4) 高 效 可 靠 地 传输 数据 。 尽 管 FTP 协议 可 由 用 户 直接 在 客户 端 
使 用 ， 但 其 主要 是 针对 应 用 程序 进行 设计 的 。 


13.1.2 ”文件 访问 和 传输 


许多 网 络 系统 都 提供 了 访问 远程 主机 上 文件 的 能 力 。 设 计 者 尝试 了 各 种 不 同 的 方法 来 实 
现 远 程 文件 访问 ， 每 种 方法 有 其 各 自 的 目标 。 例 如 为 了 降低 计算 机 系统 的 整体 成 本 ， 设 计 者 
使 用 一 个 中 心 文件 服务 器 来 为 没有 本 地 磁盘 的 设备 提供 文件 存储 。 这 些 无 盘 设备 可 以 是 移动 
的 手持 设备 ， 可 以 通过 高 速 无 线 网 络 访问 文件 服务 器 。 另 一 个 例子 是 使 用 远程 文件 访问 来 备 
份 数据 ， 本 地 的 计算 机 存储 系统 周期 性 地 把 本 地 的 一 些 文件 传输 到 远程 计算 机 上 以 防备 重要 
数据 丢失 。 而 在 另 一 些 情况 下 ， 设 计 者 更 关心 的 是 数据 能 够 在 多 个 应 用 程序 、 多 个 用 户 及 多 
个 主机 之 间 进 行 共享 ， 一 个 组 织 可 能 会 采用 一 个 独立 的 对 数据 进行 规范 管理 的 数据 库 服务 器 
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来 为 组 织 内 的 各 个 用 户 提供 文件 共享 服务 。 
13.1.3 ”在线 共享 访问 


文件 共享 主要 有 两 种 方式 : 在 线 及 时 共享 和 文件 整体 复制 。 在 线 共 享 访问 意味 着 多 个 应 
用 程序 可 以 同时 访问 同一 个 文件 ， 对 文件 的 改动 将 随即 影响 所 有 访问 它 的 程序 。 而 文件 整体 
复制 是 指 当 程序 需要 访问 一 个 文件 时 ， 它 将 获得 该 文件 的 一 个 本 地 复制 ， 复 制 通常 是 用 于 只 
读 的 数据 ， 但 一 旦 数据 需要 被 修改 ， 它 必须 修改 本 地 的 这 份 复制 并 覆盖 远程 原始 主机 的 该 
文件 。 

许多 人 认为 在 线 共享 访问 只 能 通过 数据 库 服务 器 的 方式 来 提供 文件 的 共享 访问 ， 但 实际 
上 文件 共享 并 没有 这 么 复杂 化 并 且 是 相当 易于 使 用 的 。 在 线 文件 共享 并 不 需要 远程 客户 端 像 
数据 库 系统 那样 使 用 一 个 特定 的 客户 端 软件 ， 而 是 把 远程 文件 系统 集成 到 本 地 文件 系统 中 来 
的 ， 对 于 用 户 来 讲 这 种 集成 是 透明 的 ， 可 以 像 使 用 本 地 文件 一 样 来 使 用 远程 文件 。 可 以 把 远 
程 文件 作为 应 用 程序 的 输入 和 输出 。 

远程 文件 共享 透明 化 的 好 处 是 显而易见 的 ， 因 为 对 应 用 程序 来 讲 远程 文件 和 本 地 文件 是 
无 区 别 的 。 用 户 程序 就 可 以 同时 访问 本 地 和 远程 文件 并 对 它们 中 的 数据 进行 互 操作 。 相 对 而 
言 ， 这 样 做 的 缺点 则 不 是 很 明显 ， 其 缺点 在 于 如 果 在 程序 运行 过 程 当中 网 络 或 者 远程 主机 出 
现 故 障 ， 则 应 用 程序 将 无 法 正常 运行 。 即 便 远 程 主机 不 出 现 故障 ， 但 是 网 络 或 者 主机 的 负载 
过 重 时， 也 会 使 得 程序 运行 得 很 缓慢 ， 甚 至 超时 出 错 ， 并 且 这 样 的 状况 出 现时 不 可 预料 ， 最 
终结 果 将 会 使 得 应 用 程序 的 稳定 性 大 大 降低 。 

姑且 忽视 这 些 缺 点 ， 要 实现 一 个 集成 的 透明 的 文件 共享 系统 也 是 非常 困难 的 。 在 一 个 异 
构 的 系统 中 ， 一 台 机 器 上 的 文件 名 未 必 都 能 转换 成 另 一 台 机 器 中 的 文件 名 。 相 应 的 ， 一 个 远 
程 文件 共享 系统 还 必须 要 解决 文件 所 有 权 、 用 户 授权 和 访问 保护 等 问题 ， 而 这 些 问 题 是 不 能 
够 跨 主 机 传递 的 。 最 后 对 各 个 文件 的 表示 和 操作 各 个 系统 也 是 不 一 样 的 ， 要 对 所 有 的 文件 实 
现 所 有 的 操作 是 很 难 的 甚至 是 不 可 能 的 。 


13.1.4 ”文件 传输 共享 


对 实时 在 线 文件 共享 方式 的 蔡 换 手段 就 是 文件 传输 共享 。 使 用 文件 传输 机 制 的 远程 数据 
访问 可 分 为 两 步 : 首先 用 户 获得 远程 文件 的 一 份 本 地 复制 ， 然 后 再 对 这 份 复制 进行 操作 。 大 
多 数 的 文件 传输 共享 机 制 是 和 本 地 的 文件 系统 相 分 离 的 ， 用 户 必须 通过 调用 一 个 特定 的 客户 
端 软件 来 获取 远程 文件 的 复制 。 调 用 客户 端 软件 时 , 用 户 首先 指明 远程 文件 所 在 的 机 器 地 址 ， 
并 且 可 能 要 提供 一 定 的 认证 信息 〈 如 用 户 名 、 口 令 ) 来 获取 文件 的 访问 权 ， 一 旦 文件 传输 结 
束 ， 用 户 结束 客户 端 程序 ， 就 可 以 使 用 本 地 的 应 用 程序 来 处 理 这 份 复 制 了 。 整 体 文件 复制 的 
一 个 优点 是 一 旦 传输 完毕 ， 本 机 系统 就 可 以 对 它 进 行 完全 的 有 效 的 访问 和 操作 ， 所 以 在 通常 
情况 下 这 种 方式 要 比 实时 在 线 文件 共享 程序 运行 效率 更 高 。 

和 在 线 系统 一 样 ， 在 异 构 系 统 间 的 整体 文件 传输 可 能 是 很 困难 的 。 客 户 端 和 服务 器 必须 
要 在 用 户 授 权 、 文 件 所 有 权 、 访 问 保护 和 数据 格式 等 问题 上 达成 一 致 ， 后 者 显得 尤为 重要 ， 
因为 处 理 得 不 好 的 话 逆向 传输 将 无 法 实现 。 文 件 表 示 的 具体 格式 差异 以 及 为 了 消除 这 些 差异 
所 采用 的 技术 和 文件 传输 中 所 涉及 的 具体 系统 紧密 相关 。 进 一 步 地 说 ， 我 们 现在 还 不 能 解决 
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所 有 异 构 系统 的 数据 表示 问题 ， 从 一 种 格式 转化 为 另 一 种 格式 可 能 会 造成 数据 丢失 。 但 是 倒 
并 不 需要 了 解 所 有 系统 间 的 具体 差异 ， 这 些 差异 也 不 是 至 关 重 要 的 ， 记 住 TCP/IP 协议 族 本 
身 就 是 针对 异 构 系 统 间 的 交互 而 设计 的 ，FTP 协议 作为 其 中 的 一 部 分 将 会 体现 这 样 的 特点 。 


13.1.5 FTP 协议 的 特点 


文件 传输 是 使 用 最 广泛 的 TCP/IP 应 用 之 一 ， 在 现 有 的 网 络 流量 中 占 相当 大 的 比例 。 其 
实在 TCP/IP 成 为 实际 可 用 的 标准 之 前 ， 标 准 的 文件 传输 协议 就 已 经 存在 了 ， 这 些 早期 的 文 
件 传输 标准 已 被 集成 到 现在 的 这 个 文件 传输 协议 (File Transfer Protocol) H, 主要 以 RFC959 
为 规范 。 

如 果 已 有 一 个 可 靠 的 端 到 端的 传输 协议 如 TCP， 那 么 文件 传输 看 起 来 也 许 是 很 容易 的 事 
情 。 不 过 ， 事 实 上 正如 在 前 文中 所 指出 的 ， 在 异 构 系 统 间 的 授权 、 命 名 、 表 示 等 工作 使 得 这 
个 协议 变 得 很 复杂 。 也 就 是 说 FTP 协议 还 提供 了 除 文件 传输 本 身 之 外 的 其 他 一 些 功能 。 

1. 交互 式 访问 

尽管 FTP 协议 是 针对 应 用 程序 的 使 用 所 设计 的 ， 但 大 多 数 的 协议 实现 都 为 用 户 自己 与 远 
程 服务 器 的 交互 提供 了 很 好 的 交互 式 接口 。 例 如 ， 用 户 可 以 要 求 列 出 远程 机 器 上 的 特定 目录 
下 的 所 有 文件 。 另 外 用 户 还 可 以 通过 Help 命令 来 获取 可 以 使 用 的 FTP 命令 的 帮助 信息 。 

2. 格式 (表示 ) 指定 

FIP 允许 客户 端 指定 数据 存储 的 类 型 和 格式 。 例 如 ， 用 户 可 以 指定 一 个 文件 是 否 包含 文 
本 或 二 进 制 整数 以 及 文本 文件 采用 的 是 ASTI 码 集 还 是 EBCDIC HR. 

3. 认证 控制 

FIP 要 求 客户 端 通过 发 送 用 户 名 和 口令 来 获得 文件 访问 的 授权 。 如 果 不 能 提供 有 效 的 用 
户 名 和 口令 将 被 拒绝 访问 服务 器 。 


13.1.6 FTP 模型 


和 其 他 服务 器 一 样 ， 大 多 数 的 FTP 服务 器 实现 都 允许 同时 被 多 个 客户 端 所 访问 。 客 户 端 
通过 TCP 协议 (Telnet) 连接 到 服务 器 。 服 务 器 端的 FTP 解释 器 进程 接受 并 管理 客户 端 发 起 
的 控制 连接 ， 同 时 启动 另 一 个 数据 传输 连接 进程 。 控 制 连接 接受 用 户 的 命令 并 告知 服务 器 传 
输 哪些 文件 , 数据 传输 连接 仍 使 用 TCP 作为 传输 协议 来 传输 所 有 的 数据 。 在 客户 端 和 服务 器 
端 使 用 FTP 的 模型 如 图 13.1 所 示 。 

在 图 13.1 所 示 的 模型 中 ， 涉 及 的 相关 的 名 词 解 释 如 下 : 

控制 连接 : 服务 器 和 客户 端的 FTP 协议 解释 器 间 传递 命令 及 回复 的 通信 链 路 ， 该 连接 基 
于 Telnet 协议 。 

数据 连接 : 负责 实际 数据 传输 的 全 双 工 通信 链 路 ， 有 其 特定 的 模式 和 类 型 ， 其 传输 的 数据 
可 以 是 一 个 文件 的 一 部 分 ， 也 可 以 是 整个 文件 或 多 个 文件 ， 该 连接 可 以 存在 于 一 个 服务 器 数据 
传输 进程 和 一 个 客户 端 数据 传输 进程 之 间 ， 也 可 以 存在 于 两 个 服务 器 数据 传输 进程 之 间 。 

数据 端口 : 被 动 的 数据 传输 进程 通过 监听 该 端口 来 获取 主动 数据 传输 进程 的 连接 请 求 以 
便 打开 数据 连接 。 

数据 传输 进程 :数据 传输 进程 用 以 建立 和 管理 数据 连接 ， 可 以 是 主动 模式 的 也 可 是 被 动 
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模式 的 。 

协议 解释 器 : 协议 在 客户 端 和 服务 器 端的 功能 是 完全 不 一 样 的 ， 所 以 客户 端 和 服务 器 端 
Qna) 的 协议 解释 器 也 很 不 一 样 。 

服务 器 端 数据 传输 进程 ， 在 通常 的 主动 模式 下 ， 它 通过 监听 数据 端口 来 建立 数据 连接 ， 
为 数据 传输 和 存储 设置 参数 并 根据 其 协议 解释 器 的 命令 进行 数据 传输 。 它 也 可 设置 为 被 动 模 
式 来 获取 数据 连接 而 不 是 初始 化 一 个 数据 连接 。 

用 户 : 希望 获得 文件 传输 服务 的 人 或 者 进程 。 


客户 端 FTP 系 统 
用 户 接 口 <+—> HP 

服务 器 端 FTP 系 统 
ü FTP 命 令 

FTP 协 议 解 释 器 | FIPag |” FTP 协 议 解释 器 

数据 传输 进程 | 数据 传输 进程 
] TCP/IP 网 络 | 

文件 系统 文件 系统 


注 : 1. 数据 连接 可 以 是 任 一 方向 的 
2. 数据 连接 并 不 存在 于 FIP 交互 的 全 过 程 
图 13.1 FTP 使 用 模型 


从 图 中 可 以 看 出 , 客户 端 向 服务 器 发 起 的 控制 连接 为 一 个 TCP 连接 , 而 与 之 相关 的 数据 
传输 连接 为 另 一 个 TCP 连接 。 通 常 控制 连接 要 一 直 持续 到 两 者 之 间 的 FTP 会 话 结 束 ， 而 数 
据 传 输 连接 是 每 次 文件 传输 前 建立 ， 传 送 完 毕 后 即 撤销 。 总 的 来 说 ， 数 据 传输 连接 以 及 使 用 
该 连接 的 数据 传输 进程 是 按照 需要 动态 建立 的 , 而 控制 连接 要 贯穿 整个 FTP 会 话 的 始末 。 一 
旦 控制 连接 撤销 ， 则 FTP 会 话 中 断 ， 同 时 两 边 的 所 有 数据 连接 中 断 。 


13.1.7 TCP 端口 号 的 分 配 


当 一 个 客户 端 向 服务 器 发 起 一 个 连接 时 ， 客 户 端 本 机 使 用 一 个 随机 分 配 的 协议 端口 号 ， 
而 通过 众所周知 的 服务 器 21 端口 来 与 之 通信 。 我 们 知道 ， 一 个 服务 器 可 以 使 用 同一 个 端口 
来 与 多 个 不 同 的 客户 端 通信 ,因为 TCP 可 以 根据 终端 的 不 同 来 区 分 各 个 连接 。 而 当 需 要 新 建 
一 个 用 于 数据 传输 的 TCP 连接 时 , 显然 它们 将 不 可 以 使 用 控制 连接 中 的 原 有 端口 , 这 时 客户 
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端 重新 获取 一 个 未 被 使 用 的 TCP 端口 ， 而 服务 器 端 则 使 用 系统 预 留 的 20 端口 来 进行 FTP 的 
数据 传输 。 为 了 确保 服务 器 端的 数据 传输 进程 确实 是 和 客户 端的 正确 的 数据 传输 进程 交互 ， 
服务 器 端 必须 拒绝 从 未 知 的 进程 发 起 的 数据 连接 。 这 样 ， 当 它 响应 TCP 连接 请 求 时 ， 服 务 器 
需要 自己 指定 通信 时 使 用 的 客户 端 端口 号 。 这 时 我 们 就 能 够 理解 为 什么 协议 需要 使 用 两 个 
TCP 连接 了 ， 首 先 客户 端 协议 解释 器 申请 一 个 本 地 端口 用 于 文件 传送 ， 并 在 本 地 生成 一 个 传 
送 进程 侦 听 该 端口 ， 然 后 通过 控制 连接 把 该 端口 号 传 给 服务 器 ， 最 后 等 待 服务 器 向 该 端口 建 
立 一 个 TOP 连接 。 也 就 是 说 ， 除 了 传送 FTP 命令 外 ， 控 制 连接 还 被 用 来 统一 协调 客户 端 和 
服务 器 之 间 动 态 数据 传输 连接 建立 及 端口 号 指定 。 

FIP 在 控制 连接 上 交互 的 数据 使 用 的 格式 并 没有 采用 新 的 规范 ， 而 是 采用 了 网 络 虚拟 终 
端 协议 Telnet。 然 而 和 完整 的 Telnet 协议 不 同 的 是 ，FTP 不 允许 在 命令 中 包含 可 选 参数 ， 而 
是 只 使 用 了 基本 的 网 络 虚拟 终端 定义 。 这 样 , 对 FTP 控制 连接 的 管理 要 比 标准 的 Telnet 连接 
简单 得 多 。 通 过 直接 使 用 Telnet 协议 简化 了 FTP 协议 所 要 考虑 的 问题 域 。 


13.1.8 基本 的 客户 端 -服务 器 交互 


客户 端 和 服务 器 端的 交互 一 般 是 这 样 ， 客 户 端 向 服务 器 发 送 命令 ， 服 务 器 须 向 客户 端 发 
送 回 复 ， 命 令 和 回复 通过 控制 连接 完成 ， 命 令 是 大 小 写 无 关 的 ， 而 回复 包括 如 下 内 容 : 3 位 
长 的 数字 代码 和 文本 ， 数 字 用 于 向 程序 指示 状态 而 文本 向 用 户 指示 状态 。 回 复 也 可 以 是 多 行 
的 。 可 以 看 到 整个 交互 过 程 中 控制 连接 本 身 不 传送 任何 数据 。 

对 文件 传输 协议 命令 的 回复 主要 是 为 了 实现 文件 传输 过 程 中 请 求 与 相应 的 同步 ， 确 保 客 
户 端 进程 知道 服务 器 的 当前 状态 。 每 个 客户 端 传 出 的 命令 至 少 应 能 得 到 一 个 回复 ， 有 些 得 到 
的 是 多 个 回复 ， 这 时 多 个 回复 必须 很 容易 地 被 区 分 。 另 外 ， 一 些 命令 是 有 序 的 ， 例 如 USER， 
PASS 和 ACCT, 或 者 RNFR 和 RNTO。 对 它们 的 回复 反映 了 如 果 所 有 的 命令 得 以 成 功 执行 
的 中 间 状 态 。 该 系列 命令 中 任 一 个 的 执行 失败 将 需要 从 头 把 它们 重新 执行 一 遍 。 每 个 FTP 回 
复 包 括 3 位 长 的 数字 码 并 紧 跟 着 一 段 文字 说 明 。 数 字 被 设计 用 来 自动 确定 下 一 步 所 要 进入 的 
状态 ， 文 本 主要 是 用 于 人 为 操作 。 实 际 上 ， 数 字 已 经 包括 了 足够 的 编码 信息 ， 所 以 用 户 端 协 
议 解释 器 不 需要 检查 其 后 所 带 的 文本 并 且 可 以 选择 是 否 发 送 给 用 户 。 另 外 ， 这 些 文本 也 是 和 
各 个 FTP 服务 器 相关 的 ， 对 同一 个 回复 码 文本 可 能 是 不 一 样 的 。 

一 个 回复 被 定义 为 包括 3 位 长 的 数字 码 后 跟 一 个 空格 ， 然 后 是 一 行文 本 〈 通 常 最 大 行 长 
度 已 规定 好 ) ， 最 后 是 Telnet 的 行 终结 符 。 不 过 有 时 文本 的 长 度 不 止 一 行 ， 这 时 整个 文本 需 
要 被 标记 起 来 ， 这 样 客户 端 进程 就 知道 什么 时 候 可 以 暂停 读 取 回 复 ( 例 如: 暂时 停止 处 理 控 
制 连接 上 的 输入 以 处 理 其 他 事情 ) 。 这 就 需要 回复 的 第 一 行 做 些 格式 处 理 来 表明 将 有 更 多 的 
文本 行 ， 而 在 最 后 一 行 也 需要 特定 的 格式 来 指明 这 是 最 后 一 行 ， 这 其 中 至 少 要 有 一 行 包 括 适 
当 的 回复 码 来 指示 当前 处 理 的 状态 。 为 了 尽 可 能 减少 冲突 ， 第 一 行 和 最 后 一 行 的 回复 码 必 须 
一 致 。 这 样 对 于 多 行 的 回复 其 格式 应 该 是 这 样 ， 第 一 行 以 原本 的 回复 码 开 始 ， 后 面 立即 跟 一 
个 连 字符 “-” 然 后 跟 文 本 ， 最 后 一 行 以 同样 的 回复 码 开 始 ， 后 面 跟 一 个 空格 ， 然 后 可 以 有 一 
些 文本 ， 最 后 以 Telnet 行 结束 符 来 结束 。 

例 : 

123- 第 一 行 
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第 二 行 
234 以 数字 开始 的 另 一 行 
123 最 后 一 行 


13.1.9 FTP 命令 


13.1.9.1 访问 控制 命令 


以 下 命令 用 于 指定 控制 标识 〈 命 令 码 在 括号 中 表示 ) 。 

O 用户 名 (USER) 

参数 域 是 一 个 Telnet 字符 串 用 以 标识 一 个 用 户 , 用 户 标志 是 服务 器 提供 文件 访问 所 必需 
的 。 这 个 命令 通常 是 控制 连接 建立 后 用 户 需 传送 的 第 一 个 命令 ,一 些 服务 器 可 能 还 要 求 通过 
口令 和 账号 命令 的 形式 来 提供 一 些 更 多 的 信息 。 服务 器 也 可 以 允许 在 任何 时 候 使 用 一 个 新 
的 用 户 名 命令 来 改变 控制 和 账号 信息 。 这 样 可 以 清空 所 有 已 经 提供 的 用 户 名 、 口 令 和 账号 信 
息 并 重新 开始 登录 过 程 。 所 有 的 传输 参数 都 保持 不 变 并 且 正 在 传输 的 所 有 的 文件 可 以 在 原 有 
控制 参数 下 传输 结束 。 

口 口令 (PASS) 

参数 域 是 一 个 Telnet 字符 串 用 以 给 出 用 户 的 口令 。 对 一 些 站 点 来 讲 ， 该 命令 必须 在 用 户 
名 命令 结束 后 立即 执行 ， 以 完成 用 户 的 鉴别 获取 访问 控制 权 。 因 为 口令 信息 是 比较 敏感 的 ， 
有 必要 采取 一 些 措施 隐藏 或 者 不 打印 出 来 , 而 FTP 服务 器 没有 一 个 好 的 简单 可 靠 的 方法 来 实 
现 这 一 点 ， 所 以 隐藏 敏感 的 密码 信息 就 成 为 客户 端 FTP 进程 的 一 个 任务 。 

D 账号 (ACCT) 

参数 域 是 一 个 Telnet 字符 串 用 以 给 出 用 户 的 账号 。 这 个 命令 和 用 户 名 命令 没有 必然 的 关 
联 性 。 一 些 站 点 可 能 需要 用 户 提供 账号 信息 来 登录 而 另 一 些 则 只 有 请 求 一 些 特殊 访问 时 才 需 
要 ， 如 上 传 文件 。 对 于 后 者 该 命令 可 以 在 任何 时 候 执行 。 

为 了 区 分 开 不 同 的 状况 以 便 自 动 化 处 理 ， 系 统 提供 了 这 些 数字 码 : 当 账 号 被 要 求 用 来 登 
录 时 对 口令 命令 成 功 的 提示 码 是 332， 如 果 登 录 不 需要 账号 信息 ， 口 令 命 令 成 功 的 回复 码 是 
230。 而 如 果 账 号 信息 是 将 被 以 后 会 话 中 的 某 个 命令 所 需 用 到 的 ， 服 务 器 会 依据 是 否 保存 该 
命令 信息 而 返回 332 或 者 532。 

DO 改变 工作 目录 (CWD) 

O 转 至 上 层 目 录 (CDUP) 

转 至 上 层 目 录 是 改变 工作 目录 命令 的 特例 ， 该 命令 用 以 简化 在 对 上 层 目 录用 不 同 符号 表 
示 的 操作 系统 间 进 行文 件 传输 的 实现 。 

口 ” 结 构 挂 载 (SMNT) 

该 命令 允许 用 户 挂 载 一 个 不 同 的 文件 系统 的 数据 结构 而 不 需要 改变 他 的 登录 信息 和 
账号 信息 。 传 输 参 数 基本 不 变 ， 关键 在 于 用 于 指定 一 个 目录 或 系统 的 名 称 跟 具 体 的 文件 系统 
有 关 。 

D) ”重新 初始 化 (REN) 

该 命令 将 挂 起 一 个 用 户 ， 清 空 所 有 的 输入 输出 和 账号 信息 ， 不 过 允许 正在 传输 的 进程 正 
常 完成 。 所 有 的 参数 都 将 复位 到 初始 状态 而 控制 连接 仍然 处 于 打开 状态 。 这 对 于 用 户 及 时 发 
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现 自己 所 处 的 状态 是 很 重要 的 。 在 此 之 后 一 般 紧 跟着 的 是 用 户 名 命令 。 

口 注销 (QUIT) 

该 命令 执行 时 如 果 传 输 不 正在 进行 将 注销 一 个 用 户 ， 并 关闭 控制 连接 。 如 果 文件 传输 正 
在 进行 ， 连 接 将 一 直 等 到 最 后 的 结果 返回 然后 再 被 关闭 。 如 果 用 户 进程 正在 为 多 个 用 户 传输 
数据 ， 但 不 希望 一 下 子 全 部 关闭 然后 再 逐一 打开 ， 这 时 可 以 使 用 重新 初始 化 命令 来 蔡 代 注销 
命令 。 另 外 ， 当 控制 连接 遇 到 突然 的 关闭 时 也 将 导致 服务 器 主动 采取 中 止 (ABOR) 命令 和 
注销 (QUIT) 命令 。 
13.1.9.2 传输 参数 命令 


所 有 的 传输 参数 都 有 默认 值 ， 传 输 参 数 命令 只 有 在 需要 改变 参数 的 默认 值 时 才 需 要 被 使 
用 。 默 认 值 是 最 后 被 给 定 的 值 ， 或 者 说 如 果 参 数 没有 值 被 指定 ， 将 用 标准 的 默认 值 来 蔡 代 。 
这 就 意味 着 服务 器 必须 “记得 ”应 用 的 默认 值 。 这 些 命令 可 以 以 任何 顺序 给 出 ， 不 过 必须 在 
FTP 服务 请 求 之 前 。 以 下 命令 被 用 来 指定 传输 参数 。 

C) 数据 端口 (PORT) 

这 个 参数 用 来 指定 数据 连接 中 的 主机 端口 号 。 对 于 客户 端 和 服务 器 来 讲 数据 端口 都 是 有 
默认 值 的 ， 所 以 在 通常 情况 下 并 不 需要 使 用 该 命令 及 其 回复 。 该 命令 被 使 用 时 ， 其 参数 域 的 
值 应 该 是 一 个 32 位 的 因特网 主机 IP 地 址 加 上 一 个 16 位 的 主机 端口 号 的 字 串 , 地址 信息 分 为 
8 位 一 组 以 十 进 制 表示 ， 组 间 以 逗号 分 隔 。 一 个 数据 端口 命令 的 例子 如 下 : 

PORT h1,h2,h3,h4,p1,p2 

这 里 hl 是 因特网 地 址 的 高 8 位 。 

O Wiz) (PASV) 

该 命令 要 求 服务 器 端的 数据 传输 进程 侦 听 数据 端口 〈 默 认 数 据 端 口 ) ， 当 收 到 一 个 传输 
命令 之 后 它 将 在 该 端口 等 候 一 个 连接 而 不 是 主动 初始 化 一 个 连接 。 对 该 命令 的 响应 包括 服务 
器 正在 侦 听 的 主机 和 端口 地 址 。 

O ”表示 类 型 (TYPE) 

后 面 跟 的 参数 用 来 指定 数据 表示 和 存储 的 格式 类 型 。 有 些 类 型 可 能 还 有 第 二 个 参数 。 第 
一 个 参数 用 一 个 Telnet 字符 表示 , 用 以 指示 文本 是 ASCH 或 是 EBCDIC 编码 , 第 二 个 参数 为 
一 个 十 进 制 整 数 用 以 指示 字 节 的 大 小 。 两 个 参数 之 间 用 一 个 空格 键 分 隔 。 

O 数据 结构 (STRU) 

其 参数 为 一 个 Telnet 字符 用 以 指示 数据 存储 和 表示 的 格式 。 

以 下 代码 用 来 指定 数据 格式 : 

F- 文件 〈 无 记录 结构 ) R - 记录 结构 P- 页 面 结构 

默认 的 结构 类 型 为 文件 。 

O FERRI (MODE) 

其 参数 是 一 个 Telnet 字符 用 来 指定 传输 的 模式 。 

以 下 代码 用 以 指定 文件 传输 模式 : 

S- 数据 流 式 B- 数据 块 式 C- 压缩 模式 

默认 的 数据 传输 模式 是 数据 流 式 。 
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13.1.9.3 FTP 服务 命令 


FTP 服务 命令 用 来 指定 用 户 请 求 的 文件 传输 及 文件 系统 的 相关 功能 。FTP 服务 命令 的 参 
数 通常 是 一 个 文件 路 径 。 文 件 路 径 的 语法 必须 符合 服务 器 端的 格式 规范 (具有 标准 的 默认 普 
适 性 ) 和 控制 连接 的 语言 规范 。 默 认 的 处 理 方式 是 使 用 最 终 被 确定 的 盘 符 、 目 录 或 文件 名 或 
是 本 地 用 户 的 标准 默认 设置 。 这 些 命令 可 以 以 任何 次 序 执行 ， 不 过 获得 重 命名 命令 后 面 需要 
跟 重 命名 命令 ， 而 重新 启动 命令 后 须 跟 中 断 服务 命令 Cl: STOP 或 RETR) 。 文 件数 据 将 
根据 FTP 服务 命令 的 要 求 通过 数据 传输 连接 发 送 , 而 一 些 特 定 的 回复 信息 则 通过 控制 连接 发 
送 。 以 下 命令 用 来 指定 FTP 服务 请 求 。 

O 获取 (RETR) 

该 命令 将 要 求 服务 器 端的 数据 传送 进程 发 送 参 数 中 所 指定 路 径 的 文件 的 一 份 复制 至 数 
据 传输 连接 另 一 端的 客户 端 。 而 服务 器 端的 该 文件 的 内 容 和 状态 都 不 会 发 生 改 变 。 

O 存储 (STOR) 

该 命令 将 要 求 服务 器 端的 数据 传输 进程 接受 数据 连接 传送 过 来 的 数据 ， 并 按 指定 的 路 径 
把 它们 存储 至 服务 器 端 。 如 果 路 径 中 指定 的 位 置 已 经 存在 同名 文件 则 会 被 传输 来 的 数据 所 蔡 
代 ， 而 如 果 该 位 置 原来 没有 同名 文件 则 会 创建 一 个 新 的 文件 。 

O ”惟一 存储 (STOU) 

O ”附加 (连同 创建 ) (APPE) 

该 命令 将 使 服务 器 端的 数据 传输 进程 从 数据 连接 中 接受 数据 然后 在 服务 器 端 存储 该 数 
据 ， 如 果 指 定 的 路 径 上 已 经 有 同名 的 文件 则 数据 被 附加 到 原 有 文件 上 ， 否 则 就 新 建 一 个 数据 
文件 。 

口 分 派 (ALLO) 

口 重新 启动 (REST) 

参数 域 指示 服务 器 端 哪 一 个 文件 传输 进程 需要 被 重启 。 该 命令 不 会 引起 文件 传输 ， 而 是 
会 跳 转 至 文件 的 某 个 特定 断 点 ， 该 命令 后 面 须 跟随 适当 的 FTP 服务 命令 来 使 传输 恢复 。 

C) 中 止 (ABOR) 

该 命令 让 服务 器 取消 前 一 个 FTP 服务 命令 的 执行 以 及 与 其 相关 的 数据 传输 。 

O MR (DELE) 

O ”删除 目录 (RMD) 

C 新 建 目录 (MKD) 

O 输出 工作 目录 (PWD) 

O 文件 清单 (LIST) 

该 命令 使 得 服务 器 发 送 一 份 文件 列表 到 被 动 的 数据 传输 进程 。 如 果 在 参数 域 的 路 径 指定 
了 文件 目录 或 某 个 文件 组 ， 服 务 器 将 把 该 目录 下 的 所 有 文件 名 列 出 来 ， 如 果 路 径 是 指向 一 个 
确定 的 文件 的 ， 服 务 器 将 给 出 该 文件 的 具体 信息 。 如 果 参 数 域 中 不 给 定 路 径 ， 那 么 默认 路 径 
为 当前 工作 目录 。 这 些 数据 以 ASCI 码 或 EBCDIC 码 的 形式 在 数据 连接 上 传输 (用 户 必须 自 
己 确认 究竟 是 ASCH 码 还 是 EBCDIC 码 ) 。 文件 的 具体 信息 因 系 统 的 不 一 样 而 会 有 很 大 的 变 
化 ， 所 以 这 些 信息 对 程序 自动 化 处 理 没 有 多 大 意义 ， 不 过 对 人 来 说 却 很 有 价值 。 

O 名 称 列表 (NLST) 

该 命令 将 使 服务 器 把 目录 列表 发 给 客户 端的 站 点 ， 参 数 域 的 路 径 指定 了 文件 目录 或 某 个 
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文件 组 ， 如 果 参 数 域 中 不 给 定 路 径 ， 那 么 默认 路 径 为 当前 工作 目录 。 服 务 器 将 返回 一 串 文件 
名 而 不 包含 其 他 任何 信息 。 这 些 数据 以 ASCI 码 或 EBCDIC 码 的 形式 在 数据 连接 上 传输 (用 
户 仍 需 确保 编码 格式 正确 ) 。 该 命令 被 用 来 返回 一 些 信息 以 便 程序 可 以 自动 作 进一步 的 文件 
处 理 ， 比 如 多 个 文件 获取 操作 等 。 

DO ”站 点 参数 (SITE) 

该 命令 被 服务 器 端 用 来 向 外 提供 根本 系统 密切 相关 的 一 些 服务 说 明 信 息 ， 这 些 信息 对 文 
件 传输 来 讲 是 至 关 重 要 的 , 但 还 不 是 完备 的 。 可 以 通过 HELP SITE 命令 获取 更 多 有 关 服 务 器 
文件 服务 参数 和 语法 的 规格 说 明 。 

口 系统 (SYST) 

该 命令 被 用 来 检查 服务 器 端的 操作 系统 信息 ， 其 回复 将 包括 操作 系统 名 称 的 第 一 单词 。 

口 状态 (STAT) 

该 命令 的 执行 结果 为 客户 端 将 得 到 一 个 从 控制 连接 发 回 的 有 关 当 前 状态 的 回复 。 该 命令 
可 以 在 进行 文件 传输 时 执行 以 返回 传输 的 进展 状况 ， 也 可 以 在 文件 传输 的 间隙 执行 该 命令 。 
对 于 后 者 来 说 可 以 附带 参数 ， 如 果 参 数 为 一 个 路 径 ， 那 么 其 执行 的 结果 类 似 于 LIST 命令 ， 
不 同 的 是 数据 是 从 控制 连接 发 送 的 。 如 果 只 给 出 部 分 路 径 ， 那 么 服务 器 将 返回 与 之 相关 的 文 
件 名 列表 或 是 属性 信息 。 如 果 不 给 任何 参数 ， 服 务 器 将 返回 通用 的 FTP 服务 状态 信息 ， 其 中 
包括 所 有 的 传输 参数 和 连接 状态 。 

C) 帮助 (HELP) 

该 命令 将 使 得 服务 器 根据 自身 的 实现 方式 通过 控制 连接 发 送 一 些 有 用 的 信息 给 用 户 。 它 
也 可 以 带 参 数 〈 如 任何 的 命令 名 ) ， 将 可 以 得 到 从 控制 连接 返回 的 更 为 详尽 的 信息 。 回 复 码 
为 211 R# 214. RFC 文档 建议 HELP 命令 可 以 在 USER 命令 执行 前 使 用 。 程 序 可 以 通过 这 
些 反 馈 自动 设置 一 些 与 站 点 相关 的 参数 ， 如 执行 HELP SITE。 

D) 打探 (NOOP) 

该 命令 不 会 对 任何 参数 或 前 继 命令 产生 影响 ， 也 不 产生 任何 的 实际 动作 ， 只 是 等 待 服务 
器 发 送 一 个 OK 回复 。 


13.1.10 FTP 用 户 会 话 样 例 


在 用 户 看 来 FTP 是 一 个 交互 式 的 系统 ， 一 旦 被 调用 ， 客 户 端 将 不 断 重 复 如 下 操作 : 读 取 
一 行 输入 ， 解 析 该 行 以 获取 命令 字 及 其 参数 ， 使 用 给 定 的 参数 执行 该 命令 。 下 面 给 出 一 个 在 
Windows 命令 行 窗口 下 使 用 FTP 的 样 例 。 


xiaopeng-> ftp 211.65.59.99 

Connected to 211.65.59.99. 

220 Serv-U FTP Server v4.0 for WinSock ready... 
user xiaopeng 

331 User name okay, need password. 

PASS *kkkkKKK 

230 User logged in, proceed. 

LIST 

150 Opening ASCII mode data connection for /. 
226 Transfer complete. 
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pwd 

257 "/" is current directory. 

retr /My lessons/ZjÉ.PDF 

200 PORT command okay. 

150 Opening BINARY mode data connection for /My lessons/ 多 播 .PDF (1176145bytes). 
226 Transfer complete. 

Quit 

221 Goodbye 


从 上 面 的 交互 中 ， 可 以 看 出 以 上 介绍 的 部 分 命令 的 用 法 及 相应 的 服务 器 系统 回复 状况 。 
值得 注意 的 是 在 输出 中 有 一 个 PORT 命令 , 客户 端的 PORT 命令 用 来 报告 有 一 个 新 的 端口 已 
被 获取 用 来 进行 数据 传输 。 客 户 端 把 端口 号 通过 控制 进程 传输 至 服务 器 端 ， 但 建立 一 个 新 的 
数据 连接 时 两 端 便 都 使 用 该 端口 号 。 数 据 传输 结束 后 两 端的 数据 传输 进程 关闭 数据 连接 。 


13.2 TFTP 


尽管 FTP 是 在 TCP/IP 协议 族 中 最 通用 的 文件 传输 协议 ， 但 它 同时 也 是 最 复杂 的 并 且 给 
编程 带 来 了 不 便 。 许 多 应 用 往往 并 不 需要 FTP 协议 所 提供 的 全 部 功能 , 也 支持 不 了 其 复杂 性 。 
例如 FTP 要 求 客户 端 和 服务 器 必须 要 具备 同时 管理 多 个 TCP 连接 的 能 力 ， 而 这 对 一 些 不 具 
备 复杂 操作 系统 的 个 人 计算 设备 来 讲 是 很 难 实现 的 。 

TCP/IP 协议 族 中 还 包括 另 一 个 文件 传输 协议 ， 它 可 提供 简单 的 花费 很 小 的 文件 传输 服 
务 ， 这 就 是 TFTP (Trivial File Transfer Protocol) ， 它 主要 是 针对 那些 在 客户 端 和 服务 器 将 
不 需要 复杂 交互 的 应 用 而 设计 的 。TFTP 把 操作 限制 在 简单 的 文件 传输 而 不 提供 用 户 认 证 和 
授权 等 功能 。 正 是 因为 这 些 功能 上 的 局 限 ，TFTP 的 软件 要 比 FTP 小 很 多 。 

对 许多 应 用 来 讲 ， 软 件 的 大 小 显得 很 重要 ， 比 如 无 驱 设备 的 制造 商 就 可 以 把 TFTP 的 软 
件 烧 制 在 板 载 只 读 存 储 器 (ROM) 中 并 在 机 器 加 电 时 加 载 到 内 存 中 。 存 放 在 ROM 的 程序 称 
作 引 导 程序 ， 使 用 TFTP 的 好 处 就 在 于 它 允 许 引导 程序 使 用 与 操作 系统 一 样 的 底层 TCP/IP 
协议 ， 这 样 一 台 计 算 机 就 可 以 在 另 一 个 物理 位 置 上 利用 文件 服务 器 上 的 引导 程序 启动 起 来 。 

和 FTP 协议 不 同 ，TFTP 协议 不 需要 一 个 可 靠 的 流 式 数据 传输 服务 。 它 工作 在 UDP 或 其 
他 不 可 靠 的 包 传递 服务 之 上 ， 通 过 超时 重 发 来 确保 文件 到 达 对 方 。 发 送 方 以 固定 大 小 C512 
字 节 ) 的 数据 块 发 送 数据 ， 对 每 个 数据 块 都 是 等 到 收 到 到 达 回 复 之 后 再 发 送 下 一 个 数据 块 。 
相应 地 接受 方 每 收 到 一 个 数据 块 都 发 送 回复 。 

TFTP 的 规则 是 比较 简单 的 。 发 送 的 第 一 个 数据 包 发 送 一 个 文件 传输 请 求 ， 并 在 客户 端 
和 服务 器 之 间 建 立 起 交互 ， 该 数据 包 指明 了 传送 文件 的 名 称 以 及 文件 是 被 读 取 传送 到 客户 
端 ) 还 是 被 写 入 (传送 到 服务 器 端 》。 被 传送 的 文件 数据 块 从 1 开始 顺序 编号 ， 每 个 数据 包 
头 中 都 包含 它 所 传 数据 所 属 的 数据 块 号 ， 而 接受 方 发 送 的 回复 中 也 包含 相应 的 数据 块 号 。 最 
后 一 个 不 满 512 字 节 的 数据 包 表 示 着 文件 传输 的 结束 。 另 外 ， 在 数据 和 回复 中 都 可 以 发 送出 
错 信息 ， 一 旦 检测 到 出 错 信息 ， 传 输 将 被 终止 。 

一 旦 一 个 读 取 或 者 写 入 的 请 求 被 发 送 ， 服 务 器 端 将 使 用 IP 地 址 和 UDP 端口 号 来 标志 一 
个 后 续 的 操作 。 这 样 后 面 的 传送 数据 块 的 数据 包 和 回复 的 数据 包 都 不 需要 在 包 中 包含 文件 的 
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名 称 信息 。 如 果 得 到 一 个 块 丢失 的 信息 ， 将 使 得 该 数据 块 被 重新 发 送 一 次 ， 而 在 其 他 出 错 情 
况 下 则 简单 地 引发 文件 传输 会 话 的 终止。 

TFTP 的 特别 之 处 在 于 它 是 对 称 的 ， 收 发 双方 使 用 的 都 是 超时 重 发 机 制 。 如 果 发 送 方 发 
送 数 据 超 时 ， 它 将 把 最 后 一 个 数据 块 重新 发 送 一 次 ， 而 如 果 接 受 方 发 送 回复 超时 ， 它 也 会 将 
回复 重新 发 送 一 次 。 这 种 双方 同时 检测 超时 的 机 制 确保 了 传输 不 会 因为 单个 数据 包 的 丢失 而 
宣告 失败 。 

尽管 这 种 对 称 的 方式 保证 了 文件 传输 的 健壮 性 ， 但 是 它 也 会 有 负面 的 影响 ， 可 能 会 导致 
过 多 的 数据 包 重 发 。 已 经 发 现 的 问题 是 在 最 坏 的 情况 下 可 能 会 进入 死 循 环 并 且 每 个 数据 包 都 
会 被 发 送 两 次 。 尽 管 TFTP 存在 这 个 缺陷 ， 但 是 能 够 满足 最 小 的 文件 传输 需求 ， 并 且 可 以 支 
持 多 文件 类 型 。 另 外 它 还 可 以 和 E-mail 服务 集成 在 一 起 ， 可 以 把 文件 当 作 邮件 来 发 送 。 


13.3 NFS 


NFS 最 初 由 SUN 微 系统 公司 开发 ， 全 称 为 网 络 文件 系统 (Network File System) ， 提 供 
在 线 透 明 的 集成 的 文件 共享 服务 。 许 多 站 点 都 采用 它 来 构建 文件 系统 。 从 用 户 的 观点 来 看 ， 
NES 是 感觉 不 到 的 ， 用 户 可 以 使 用 任意 地 方 的 程序 并 使 用 任何 文件 作为 输入 和 输出 。 从 文件 
名 称 本 身 不 能 看 出 一 个 文件 是 本 地 的 还 是 远程 的 。 

当 一 个 应 用 程序 执行 时 , 它 调用 操作 系统 来 打开 一 个 文件 , 或 者 读 取 存 储 文件 中 的 数据 。 
文件 访问 机 制 接受 该 请 求 并 根据 文件 是 在 本 地 磁盘 还 是 远程 机 器 把 任务 自动 交付 给 本 地 文 
件 系统 或 NFS 客户 端 。 当 它 接受 到 一 个 请 求 时 ， 客 户 端 软 件 使 用 NES 协议 跟 远 程 主机 的 对 
应 的 服务 器 通信 并 执行 所 请 求 的 操作 。 当 远程 服务 器 响应 后 , 客户 端 把 结果 返回 给 应 用 程序 。 

设计 者 在 构造 NFS 协议 时 把 它 分 成 三 个 相对 独立 的 部 分 : NFS 协议 本 身 、 一 个 通用 的 
远程 过 程 调用 (RPC) 机制 和 一 个 通用 的 扩展 数据 表示 机 制 (XDR〉。 他 们 的 初 囊 是 把 三 者 
分 开 以 便 其 他 应 用 和 协议 可 以 独立 地 使 用 RPC 和 XDR。 

从 程序 员 的 观点 来 看 ，NFS 本 身 不 提供 任何 新 的 程序 可 调用 的 方法 。 一 旦 一 个 管理 员 配 
置 好 一 个 NFS 系统 , 程序 访问 远程 文件 的 操作 和 本 地 文件 是 完全 一 样 的 ,但 是 , RPC 和 XDR 
提供 了 可 供 程序 员 使 用 的 用 以 构建 分 布 式 程序 的 机 制 。 例 如 ， 程 序 员 可 以 把 程序 分 为 客户 端 
和 服务 器 端 两 部 分 ， 两 者 之 间 以 RPC 作为 主要 的 通信 机 制 。 在 客户 端 , 程序 员 设计 一 些 过 程 
作为 远程 的 ， 让 编译 器 植 入 RPC 代码 到 这 些 过 程 中 。 在 服务 器 端 ， 程 序 员 实 现 相 应 的 过 程 并 
使 用 另 一 些 RPC 机 制 声 明 它们 是 服务 器 的 一 部 分 。 当 客户 端 程序 调用 远程 的 某 个 过 程 时 ， 
RPC 自动 收集 数据 值 和 变量 形成 一 个 消息 ， 把 该 消息 发 送 至 远程 服务 器 并 等 待 回复 ， 然 后 把 
返回 的 值 存 入 到 恰当 的 参数 中 。 在 此 过 程 中 ， 与 远程 服务 器 的 通信 基本 上 随 远 程 方法 调用 而 
自动 进行 的 。RPC 机 制 隐藏 了 协议 的 细节 ， 使 得 那些 即使 对 底层 通信 协议 知之 甚 少 的 程序 员 
也 可 以 写 出 分 布 式 程序 来 。 

另 一 个 相关 的 工具 是 XDR, 它 使 得 程序 员 在 异 构 系统 之 间 传输 数据 而 不 需要 写 任 何 转 换 
硬件 数据 表示 的 过 程 。 例 如 ， 并 不 是 所 有 的 机 器 表示 32 位 二 进 制 数 的 格式 都 是 一 样 的 。 有 
些 把 数据 的 高 位 字 节 存放 在 存储 器 的 高 地 址 处 ， 而 男 一 些 则 把 它们 放 在 低地 址 处 ， 这 样 如 果 
程序 员 使 用 网 络 把 代表 一 个 整数 的 字 节 从 一 台 机 器 移 至 另 一 台 机 器 而 不 重新 排序 则 数据 的 
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值 就 会 发 生变 化 。XDR 通过 定义 与 机 器 无 关 的 表示 格式 而 解决 了 这 个 问题 。 在 数据 传输 的 一 
端 ， 程 序 通过 调用 XDR 过 程 把 本 地 的 硬件 数据 表示 转化 为 机 器 无 关 的 数据 表示 。 一 旦 该 数 
据 需 要 被 传送 到 另 一 台 机 器 ， 则 接收 端的 程序 通过 调用 XDR 过 程 把 机 器 无 关 的 数据 表示 再 
转换 为 本 地 的 数据 表示 格式 。 

XDR 的 最 大 优势 在 于 它 自动 完成 了 绝 大 多 数 的 数据 格式 转换 工作 。 程 序 员 并 不 需要 手工 
调用 KDR 过 程 。 实际 上 他 们 只 需要 在 程序 中 向 KDR 编译 器 指明 哪些 数据 需要 被 转化 ， 那么 
编译 器 将 自动 生成 包含 XDR 库 过 程 调用 的 程序 。 
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随 着 网 络 技术 的 飞速 发 展 ， 网 络 的 数量 也 越 来 越 多 。 网 络 中 存在 着 大 量 的 诸如 工作 站 、 
服务 器 、 网 卡 、 路 由 器 、 网 桥 和 集线器 等 设备 。 如 何 管理 这 些 设备 就 变 得 十 分 重要 。 

要 对 网 络 做 出 适当 的 管理 ， 网 络 管理 员 首先 需要 了 解 网 络 中 各 种 设备 及 链 路 的 工作 状态 ， 
这 需要 网 络 管理 员 维 持 一 个 网 络 管理 信息 库 (MIB) 以 及 时 了 解 网 络 中 各 种 设备 的 工作 状态 并 
做 出 相应 的 决策 。 由 于 互联 网 规模 很 大 ， 尤 其 是 全 球 因特网 ， 其 触角 已 延伸 到 全 世界 大 多 数 国 
家 的 许多 地 方 ， 而 各 种 被 管 设备 又 分 散在 网 络 的 各 个 角落 ， 由 网 络 管理 员 手工 维护 管理 信息 库 
几乎 是 不 可 能 的 ， 必 须 借助 管理 软件 来 获取 所 有 被 管 设 备 的 状态 信息 。 这 就 要 求 管理 软件 有 与 
被 管 设备 进行 通信 的 能 力 ， 因 此 需要 有 相应 的 网 管 通信 协议 。 另 一 方面 ， 网 络 管理 信息 库 的 获 
取 及 维护 需要 被 管 设 备 的 支持 ， 即 被 管 设 备 必须 能 以 一 定 的 方式 提供 有 关 状 态 信息 。 目 前 ， 设 
备 制造 商 一 般 都 在 网 卡 、 路 由 器 、 网 桥 等 网 络 设备 中 提供 网 管 功能 ， 这 些 设备 一 般 都 能 主动 或 
被 动 地 提供 相关 信息 。 但 由 于 不 同 的 厂商 提供 的 信息 格式 和 存储 方式 千差万别 ， 要 使 得 网 络 管 
理 员 准 确 获取 并 理解 各 种 状态 信息 还 需 有 一 套 关 于 管理 信息 结构 的 统一 约定 。 

因此 ， 一 个 网 管 系统 至 少 具备 下 述 要 素 : 管理 员 和 代理 ;管理 信息 库 MIB ( Management 
Information Base) ， 管 理 信息 库 包含 所 有 可 被 查询 和 修改 的 参数 。RFC 1213[McCloghrie and 
Rose 1991] 定 义 了 第 二 版 的 MIB， 叫 做 MIB-I; 管理 信息 结构 SMI (Structure of Management 
Information) XF MIB 的 一 套 公用 的 结构 和 表示 符号 ,这 在 RFC 1155 [Rose and McCloghrie 
1990] 中 进行 了 定义 ; 通信 协议 ， 目 前 Internet 上 主要 使 用 简单 网 络 管理 协议 SNMP (Simple 
Network Management Protocol) 。RFC 1157 [Case et al. 1990] 定 义 了 简单 网 管 协 议 。 本 章 主要 
介绍 网 管 系统 中 的 一 些 基本 概念 ， 网 管 系统 的 工作 模式 。 


14.1 SNMP 体系 结构 


14.1.4. TCP/IP 网 络 管理 的 发 展 


在 TCP/IP 的 早期 开发 中 ， 网 络 管理 问题 并 未 得 到 太 大 的 重视 。 直 到 20 世纪 70 年 代 ， 
还 一 直 没 有 网 络 管理 协议 ， 只 有 互联 网 络 控制 信息 协议 CICMP) 可 以 作为 网 络 管理 的 工具 。 
ICMP 提供 了 从 路 由 器 或 其 他 主机 向 主机 传送 控制 信息 的 方法 ， 可 用 于 所 有 支持 卫 的 设备 。 
从 网 络 管理 的 观点 来 看 ，ICMP 最 有 用 的 特性 是 回声 Cecho) 和 回声 应 答 (echo reply) 消息 
对 。 这 个 消息 对 为 测试 实体 间 能 否 通信 提供 了 一 个 机 制 echo 消息 要 求 其 接收 者 在 echo reply 
消息 中 返回 接收 到 的 内 容 。 另 一 个 有 用 的 消息 对 是 时 间 改 (timestamp ) 和 时 间 惟 应 答 

(timestamp reply) ， 这 个 消息 对 为 测试 网 络 延 迟 特性 提供 了 机 制 。 
与 各 种 IP 头 选项 结合 , 这 些 ICMP 消息 可 用 来 开发 一 些 简单 有 效 的 管理 工具 。 典 型 的 例 
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子 是 广泛 应 用 的 分 组 互联 网 络 探索 (PING) 程序 。 利 用 ICMP 加 上 另外 的 选项 如 请 求 间隔 和 
一 个 请 求 的 发 送 次 数 ，PING 能 够 完成 多 种 功能 。 包 括 确定 一 个 物理 网 络 设备 能 否 寻 址 ， 验 
证 一 个 网 络 能 够 寻 址 和 验证 一 个 主机 上 的 服务 器 操作 。 

PING 在 一 些 工 具 的 配合 下 满足 了 TCP/IP 网 络 初期 的 管理 要 求 。 但 是 到 了 20 世纪 80 年 
代 后 期 ， 当 互联 网 络 的 发 展 呈 指数 增加 时 ， 人 们 感到 需要 开发 比 PING 功能 更 强 并 易于 普通 
网 络 管理 人 员 学 习 和 使 用 的 标准 协议 。 因 为 当 网 络 中 的 主机 数量 上 百 万 ， 独 立 网 络 数量 上 千 
的 时 候 ， 已 不 能 只 依靠 少数 网 络 专家 解决 管理 问题 了 。 

1987 年 11 月 发 布 了 简单 网 关 监 控 协 议 CSGMPO. ， 成 为 提供 专用 网 络 管理 工具 的 起 点 。 
SGMP 提供 了 一 个 直接 监控 网 关 的 方法 。 随 着 对 通用 网 络 管理 工具 需求 的 增长 ， 出 现 了 3 个 
有 影响 的 方法 。 

COD 高 层 实 体 管理 系统 (HEMS) : 主机 监控 协议 (HMP) 的 一 般 化 。 

(2) 简单 网 络 管理 协议 (SNMP) : SGMP 的 升级 版 。 

(3) TCP/IP 上 的 CMIP (CMOT) : 最 大 限度 地 与 OSI 标准 的 CMIP、 服 务 以 及 数据 库 
结构 保持 一 致 。 

1988 年 ， 互 联网 络 活动 会 议 (IAB) 确定 了 将 SNMP 作为 近期 解决 方案 进一步 开发 ， 而 
把 CMOT 作为 远 期 解决 方案 的 策略 。 当 时 普遍 认为 : TCP/IP 不 久 将 会 过 渡 到 OSI， 因 而 不 
应 在 TCP/IP 的 应 用 层 协 议和 服务 上 花费 太 多 的 精力 。SNMP 开发 速度 快 ， 并 能 为 网 络 管理 
经 验 库 的 开发 提供 一 些 基本 的 工具 ， 可 用 来 满足 眼前 的 需要 。 

为 了 强化 这 一 策略 ，IAB 要 求 SNMP 和 CMOT 使 用 相同 的 被 管 对 象 数 据 库 。 即 在 任何 
主机 、 路 由 器 、 网 桥 以 及 其 他 管理 设备 中 ， 两 个 协议 都 以 相同 的 格式 使 用 相同 的 监控 变量 。 
因此 ， 两 个 协议 有 一 个 公共 的 管理 信息 结构 (SMD 和 一 个 管理 信息 库 (MIB) 。 

但 是 ， 人 们 很 快 发 现 这 两 个 协议 在 对 象 级 的 兼容 是 不 现实 的 。 在 OSI 的 网 络 管理 中 ,被 
管 对 象 是 很 成 熟 的 ， 它 具有 属性 、 相 关 的 过 程 、 通 报 以 及 其 他 一 些 与 面向 对 象 有 关 的 复杂 的 
特性 。 而 SNMP 为 了 保持 简单 性 ， 没 有 这 样 复杂 的 概念 。 实 际 上 ，SNMP 的 对 象 在 面向 对 象 
的 概念 下 根本 就 不 能 称 为 对 象 , 它们 只 是 带 有 一 些 如 数据 类 型 、 读 写 特 性 等 基本 特性 的 变量 。 
因此 IAB 最 终 放 松 了 公共 SMLMIB 的 条 件 ， 并 允许 SNMP 独立 于 CMOT 发 展 。 

从 对 OSI 的 兼容 性 的 束缚 中 解脱 后 ，SNMP 取得 了 迅速 的 发 展 ， 很 快 被 众多 的 厂商 设备 
所 支持 ， 并 在 互联 网 络 中 活跃 起 来 。 而 且 ， 普 通用 户 也 选择 了 SNMP 作为 标准 的 管理 协议 。 

SNMP 最 重要 的 进展 是 远程 监控 (RMON) 能 力 的 开发 。RMON 为 网 络 管理 者 提供 了 监 
控 整 个 子 网 而 不 是 各 个 单独 设备 的 能 力 。 除 了 RMON， 还 对 基本 SNMP MIB 进行 了 扩充 。 
有 些 扩充 采用 标准 的 网 络 接口 ， 例 如 令 牌 环 (token ring) 和 光纤 分 布 数据 接口 (FDDI) , 
这 种 扩充 是 独立 于 厂商 的 。 

但 是 ， 单 靠 定义 新 的 或 更 细致 的 MIB 扩充 SNMP 是 有 限 的 。 当 SNMP 被 用 于 大 型 或 复 
杂 网 络 时 ， 它 在 安全 和 功能 方面 的 不 足 就 变 得 明显 了 。 为 了 弥补 这 些 不 足 ，1992 年 7 月 发 表 
了 3 个 增强 SNMP 安全 性 的 文件 作为 建议 标准 。 增 强 版 与 原来 的 SNMP 是 不 兼容 的 ， 它 需 
要 改变 外 部 消息 句柄 及 一 些 消息 处 理 过 程 。 但 实际 定义 协议 操作 并 包含 SNMP 消息 的 协议 数 
据 单元 PDU) 保持 不 变 ， 并 且 没有 增加 新 的 PDU。 目 的 是 尽量 实现 向 SNMP 的 安全 版 本 

但 是 这 个 增强 版 受到 了 另 一 个 方案 的 冲击 。 同 样 是 在 1992 年 7 月 ， 四 名 SNMP 的 关键 


第 14 章 SNMP 网 络 管理 体系 结构 


人 物 提出 一 个 称 为 SMP 的 SNMP 新 版 本 。 并 实现 了 四 个 可 互 操作 的 方案 。 两 个 是 商业 产品 ， 
两 个 是 公开 软件 。SMP 在 功能 和 安全 性 两 方面 提高 了 SNMP, 特别 是 SMP 增加 了 一 些 PDU。 
所 有 的 消息 头 和 安全 功能 都 与 提议 的 安全 性 增强 标准 相似 。 最 终 SMP 被 接受 为 定义 第 二 代 
SNMP 即 SNMPv2 的 基础 。1993 年 安全 版 SNMPv2 发 布 。 

经 过 几 年 试用 以 后 ，IETF (internet Engineering Task Force) 决定 对 SNMPv2 进行 修订 。 
1996 年 发 布 了 一 组 新 的 RFC (Request For Comments) ， 在 这 组 新 的 文档 中 ，SNMPv2 的 
安全 特性 被 取消 了 ， 消 息 格式 也 重新 采用 SNMPv1 的 基于 “共同 体 (community) ”概念 的 
格式 。 

删除 SNMPv2 中 的 安全 特性 是 SNMPv2 发 展 过 程 中 最 大 的 失败 。 主 要 原因 是 厂商 和 用 
户 对 1993 版 的 SNMPv2 的 安全 机 制 不 感 兴趣 , 同时 IETF 要 求 的 修订 时 间 也 非常 紧迫 ， 设 计 
者 们 来 不 及 对 安全 机 制 进行 改善 ， 甚 至 来 不 及 对 存在 的 严重 缺陷 进行 修改 。 因 此 不 得 不 在 
1996 年 版 的 SNMPv2 中 放弃 了 安全 特性 。 

1999 年 4 月 IETF SNMPv3 工作 组 提出 了 RFC2571 一 RFC2576, 形 成 了 SNMPv3 的 建议 。 
目前 ， 这 些 建议 正在 进行 标准 化 。SNMPv3 提出 了 SNMP 管理 框架 的 一 个 统一 的 体系 结构 。 
在 这 个 体系 结构 中 ， 采 用 User-based 安全 模型 和 View-based 访问 控制 模型 提供 SNMP 网 络 
管理 的 安全 性 。 安 全 机 制 是 SNMPv3 的 最 具 特 色 的 内 容 。 


14.1.2 SNMP 基本 框架 


1. 网 络 管理 体系 结构 

SNMP 的 网 络 管理 模型 包括 以 下 关键 元 素 : 管理 站 、 代 理 者 、 管 理 信息 库 、 网 络 管理 协 
议 。 管 理 站 一 般 是 一 个 分 立 的 设备 ， 也 可 以 利用 共享 系统 实现 。 管 理 站 被 作为 网 络 管理 员 与 
网 络 管理 系统 的 接口 。 它 的 基本 构成 为 : 

口 一 组 具有 分 析 数 据 、 发 现 故 障 等 功能 的 管理 程序 。 

口 一 个 用 于 网 络 管理 员 监 控 网 络 的 接口 。 

C) 将 网 络 管理 员 的 要 求 转变 为 对 远程 网 络 元 素 的 实际 监控 的 能 力 。 

O 一 个 从 所 有 被 管 网 络 实体 的 MIB 中 抽取 信息 的 数据 库 。 

网 络 管理 系统 中 另 一 个 重要 元 素 是 代理 者 。 装 备 了 SNMP 的 平台 ， 如 主机 、 网 桥 、 路 由 
器 及 集线器 均 可 作为 代理 者 工作 。 代 理 者 对 来 自 管理 站 的 信息 请 求 和 动作 请 求 进行 应 答 ， 并 
随机 地 为 管理 站 报告 一 些 重要 的 意外 事件 。 

与 CMIP 体系 相同 ， 网 络 资源 也 被 抽象 为 对 象 进行 管理 。 但 SNMP 中 的 对 象 是 表示 被 管 资 
源 某 一 方面 的 数据 变量 。 对 象 被 标准 化 为 跨 系统 的 类 , 对 象 的 集合 被 组 织 为 管理 信息 库 (MIB) o 
MIB 作为 设 在 代理 者 处 的 管理 站 访问 点 的 集合 , 管理 站 通过 读 取 MIB 中 对 象 的 值 来 进行 网 络 监 
控 。 管 理 站 可 以 在 代理 者 处 产生 动作 ， 也 可 以 通过 修改 变量 值 改变 代理 者 处 的 配置 。 

管理 站 和 代理 者 之 间 通 过 网 络 管理 协议 通信 ，SNMP 通信 协议 主要 包括 以 下 能 力 。 

O Get: 管理 站 读 取 代理 者 处 对 象 的 值 。 

口 Set: 管理 站 设置 代理 者 处 对 象 的 值 。 

O Trap: 代理 者 向 管理 站 通报 重要 事件 。 

在 标准 中 ,没有 特别 指出 管理 站 的 数量 及 管理 站 与 代理 者 的 比例 。 一 般 地 ， 应 至 少 要 有 
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两 个 系统 能 够 完成 管理 站 功能 ， 以 提供 元 余 度 ， 防 止 故障 。 另 一 个 实际 问题 是 一 个 管理 站 能 
带动 多 少 代理 者 。 只 要 SNMP 保持 它 的 简单 性 ， 这 个 数量 可 以 高 达 几 百 。 

2. 网 络 管理 协议 体系 结构 

SNMP 为 应 用 层 协 议 ， 是 TCP/IP 协议 族 的 一 部 分 。 它 通过 用 户 数据 报 协议 (UDP) 来 
操作 。 在 分 立 的 管理 站 中 , 管理 者 进程 对 位 于 管理 站 中 心 的 MB 的 访问 进行 控制 ， 并 提供 网 
络 管理 员 接口 。 管 理 者 进程 通过 SNMP 完成 网 络 管理 。SNMP 在 UDP. IP 及 有 关 的 特殊 网 
络 协 议 ( 如 Ethernet、FDDI、X.25) 之 上 实现 。 

每 个 代理 者 也 必须 实现 SNMP. UDP 和 人 P。 另 外 ， 有 一 个 解释 SNMP 的 消息 和 控制 代 
理 者 MIB 的 代理 者 进程 。 


SNMP 管 理 站 SNMP 代理 者 
| 9 DIM 
E 对 象 
H g 
$ f 
A 
3 i 
SNMP Manager M "SNMP ^ > SNMP Agent 
UDP 消息 UDP 
IP IP 
依赖 网 络 的 协议 依赖 网 络 的 协议 


网 络 或 互联 网 络 


141 SNMP 的 协议 环境 


14.1 描述 了 SNMP 的 协议 环境 。 从 管理 站 发 出 三 类 与 管理 应 用 有 关 的 SNMP 的 消息 
GetRequest、GetNextRequest、SetRequest。 三 类 消息 都 由 代理 者 用 GetResponse 消息 应 答 ， 
该 消息 被 上 交 给 管理 应 用 。 另 外 ， 代 理 者 可 以 发 出 Trap 消息 ， 向 管理 者 报告 有 关 MIB 及 管 
理 资源 的 事件 。 

由 于 SNMP 依赖 UDP， 而 UDP 是 无 连接 型 协议 ， 所 以 SNMP 也 是 无 连接 型 协议 。 在 管 
理 站 和 代理 者 之 间 没 有 在 线 的 连接 需要 维护 。 每 次 交换 都 是 管理 站 和 代理 者 之 间 的 一 个 独立 
的 传送 。 

3. 陷阱 引导 轮 询 (Trap-directed polling) 

如 果 管 理 站 负责 大 量 的 代理 者 ， 而 每 个 代理 者 又 维护 大 量 的 对 象 ， 则 靠 管理 站 及 时 地 轮 
询 所 有 代理 者 维护 的 所 有 可 读数 据 是 不 现实 的 。 因 此 管理 站 采取 陷阱 引导 轮 询 技术 对 MIB 
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进行 控制 和 管理 。 

所 谓 陷阱 引导 轮 询 技术 是 : 在 初始 化 时 ， 管 理 站 轮 询 所 有 知道 关键 信息 (如 接口 特性 ， 
作为 基准 的 一 些 性 能 统计 值 ， 如 发 送 和 接收 的 分 组 的 平均 数 ) 的 代理 者 。 一 旦 建立 了 基准 ， 
管理 站 将 降低 轮 询 频 度 。 相 反 地 ， 由 每 个 代理 者 负责 向 管理 站 报告 异常 事件 。 例 如 ， 代 理 者 
崩溃 和 重启 动 、 连 接 失 败 、 过 载 等 。 这 些 事件 用 SNMP 的 Trap 消息 报告 。 

管理 站 一 旦 发 现 异常 情况 ， 可 以 直接 轮 询 报告 事件 的 代理 者 或 它 的 相 邻 代理 者 ， 对 事件 
进行 诊断 或 获取 关于 异常 情况 的 更 多 的 信息 。 

陷阱 引导 轮 询 可 以 有 效 地 节约 网 络 容量 和 代理 者 的 处 理 时 间 。 网 络 基 本 上 不 传送 管理 站 
不 需要 的 管理 信息 ， 代 理 者 也 不 会 无 意义 地 频繁 应 答 信息 请 求 。 

4. 代 管 (Proxies) 

利用 SNMP 需要 管理 站 及 其 所 有 代理 者 支持 UDP 和 也 。 这 限制 了 在 不 支持 TCP/IP 协议 
的 设备 〈 如 网 桥 、 调 制 解 调 器 ) 上 的 应 用 。 并 且 ， 大 量 的 小 系统 PC、 工作 站 、 可 编程 控制 
器 ) 虽然 支持 TCP/IP 协议 ， 但 不 希望 承担 维护 SNMP、 代 理 者 软件 和 MIB 的 负担 。 

为 了 容纳 没有 装载 SNMP 的 设备 , SNMP 提出 了 代 管 的 概念 ,在 这 个 模式 下 , 一 个 SNMP 
的 代理 者 作为 一 个 或 多 个 其 他 设备 的 代 管 人 。 即 , SNMP 代理 者 为 托管 设备 (proxied devices) 
服务 。 

图 14.2 显示 了 常见 的 一 类 协议 体系 结构 。 管 理 站 向 代 管 代理 者 发 出 对 某 个 设备 的 查询 。 
代 管 代理 者 将 查询 转变 为 该 设备 使 用 的 管理 协议 。 当 代理 者 收 到 对 一 个 查询 的 应 答 时 ， 将 这 
个 应 答 转 发 给 管理 站 。 类 似 地 ， 如 果 一 个 来 自 托管 设备 的 事件 通报 传 到 代理 者 ， 代 理 者 以 陷 
阱 消息 的 形式 将 它 发 给 管理 站 。 


代 管 代理 者 
SNMP 管 理 站 映射 功能 托管 设备 
管理 者 管理 者 管理 
进程 进程 托管 设备 进程 
SNME SNMP | 使 用 的 托管 设备 
UDP UDP 协议 体系 使 用 的 
- = 协议 体系 
依赖 依赖 依赖 依赖 
网 络 的 网 络 的 网 络 的 网 络 的 
协议 协议 协议 协议 


图 14.2 SNMP 协议 体系 结构 
14.2 SNMP 管理 信息 


与 CMIP 体系 相同 , SNMP 的 基础 是 包含 被 管 元 素 信息 的 被 称 为 MIB 的 数据 库 。 每 个 被 
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管 资 源 由 对 象 来 表示 ，MIB 是 这 些 对 象 的 有 结构 的 集合 。 在 SNMP rh, MIB 本 质 上 是 一 个 
树 型 的 数据 库 结构 。 网 络 中 每 个 系统 都 〈 工 作 站 、 服 务 器 、 路 由 器 、 网 桥 等 ) 拥有 一 个 反映 
系统 中 被 管 资源 状态 的 MIB。 网 络 管理 实体 可 以 通过 提取 MIB 中 的 对 象 值 监测 系统 中 的 资 
源 ， 也 可 以 通过 修改 这 些 对 象 值 来 控制 资源 。 


14.2.1 管理 信息 结构 


SNMP 的 规范 SMI (structure of management information) 为 定义 和 构造 MIB 提供 了 一 个 
通用 的 框架 。 同 时 也 规定 了 可 以 在 MIB 中 使 用 的 数据 类 型 ， 说 明了 资源 在 MIB 中 怎样 表示 
和 命名 。SMI 的 基本 指导 思想 是 追求 MIB 的 简单 性 和 可 扩充 性 。 因 此 ，MIB 只 能 存储 简单 
的 数据 类 型 : 标量 和 标量 的 二 维 矩阵 。 我 们 将 看 到 SNMP 只 能 提取 标量 ， 包 括 表 中 的 单独 的 
条 目 。 

SMI 避 开 复杂 的 数据 类 型 是 为 了 降低 实现 的 难度 和 提高 互 操 作 性 。 但 在 MIB 中 不 可 避 
免 地 包含 厂家 建立 的 数据 类 型 ， 如 果 对 这 样 的 数据 类 型 的 定义 没有 严格 的 限制 ， 互 操作 性 也 
会 受到 影响 。 

为 了 提供 一 个 标准 的 方法 来 表示 管理 信息 ，SMI 必须 提供 一 个 标准 的 技术 定义 MIB 的 
有 具体 结构 ， 提 供 一 个 标准 的 技术 定义 各 个 对 象 ， 包 括 句 法 和 对 象 值 ， 提 供 一 个 标准 的 技术 对 
对 象 值 进 行 编码 。 

1. MIB 结构 

SNMP 中 的 所 有 的 被 管 对 象 都 被 排列 在 一 个 树 型 结构 之 中 。 处 于 叶子 位 置 上 的 对 象 是 实 
际 的 被 管 对 象 ， 每 个 实际 的 被 管 对 象 表示 某 些 被 管 资源 、 活 动 或 相关 信息 。 树 型 结构 本 身 定 
义 一 个 将 对 象 组 织 到 逻辑 上 相关 的 集合 之 中 的 方法 。 

MIB 中 的 每 个 对 象 类 型 都 被 赋予 一 个 对 象 标识 符 (Object Identifier) ， 以 此 来 命名 对 
象 。 另 外 ， 由 于 对 象 标识 符 的 值 是 层次 结构 的 ， 因 此 命名 方法 本 身 也 能 用 于 确认 对 象 类 型 的 
结构 。 

对 象 标识 符 是 能 够 惟一 标识 某 个 对 象 类 的 符号 。 它 的 值 由 一 个 整数 序列 构成 。 被 定义 的 
对 象 的 集合 具有 树 型 结构 ， 树 根 是 引用 ASN.1 标准 的 对 象 。 从 对 象 标识 符 树 的 树 根 开始 ， 每 
个 对 象 标识 符 成 分 的 值 指定 树 中 的 一 个 弧 。 从 树 根 开始 ， 第 一 级 有 三 个 节点 : iso、ccitt、 
joint-iso-ccitt。 如 图 14.3 所 示 在 iso 节点 下 面 有 一 个 为 “其 他 组 织 ” 使 用 的 子 树 ， 其 中 有 一 个 
美国 国防 部 的 子 树 (dod)。SNMP 在 dod 之 下 设置 一 个 子 树 用 于 Internet 的 管理 .如 下 所 
D 

Internet OBJECT IDENTIFIER :: = ( iso (1) org (3) dod (6) 1} 

FE, Internet 节点 的 对 象 标识 符 的 值 是 1.3.6.1。 这 个 值 作为 Internet 子 树 的 下 级 节点 标 
识 符 的 前 级 。 

SMI 在 Internet 节点 之 下 定义 了 四 个 节点 : 

O directory 为 与 OSI 的 directory 相关 的 将 来 的 应 用 保留 的 节点 。 

C) mgmt HFE IAB 批准 的 文档 中 定义 的 对 象 。 

O experimental 用 于 标识 在 Internet 实验 中 应 用 的 对 象 。 

D) private 用 于 标识 单方 面 定义 的 对 象 。 
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ccitt(0) iso(1) joint-iso-ccitt(2) 
ab 
da 
internet(1) 
directory(1) xin experimental(3) private(4) 
mib(1) < 一 一 1.3.6.1 enterprises(1) 
system(1) interface(2) — at(3) ip(4) icmp(5) tep(6) — udp(7) … 


PT Pn AT AR TS 


图 14.3 对象 标 识 符 树 型 结构 


mgmt 子 树 包含 IAB 已 经 批准 的 管理 信息 库 的 定义 。 现 在 已 经 开发 了 两 个 版 本 的 MIB, 
MIB-1 和 它 的 扩充 版 MIB -2。 两 者 子 树 中 的 对 象 标识 符 是 相同 的 ， 因 为 在 任何 配置 中 ， 只 有 
一 个 MIB。 

MIB 中 的 MIB -1 或 MIB -2 以 外 的 对 象 可 以 用 以 下 方法 定义 : 

口 ” 由 一 个 全 新 的 修订 版 (如 MIB -3) 来 扩充 或 取代 MIB -2。 

CO) 可 以 为 特定 的 应 用 构造 一 个 实验 MIB。 这 样 的 对 象 随后 会 被 移 到 mgmt 子 树 之 下 。 

例如 定义 包含 各 种 传输 媒体 的 MIB 〈 例 如 为 令 牌 环 局 域 网 定义 的 MIB )。 

O 专用 的 扩充 可 以 加 在 private 子 树 之 下 。 

private 子 树 目前 只 定义 了 一 个 子 节点 enteIprises， 用 于 厂商 加 强 对 自己 设备 的 管理 ， 与 
用 户 及 其 他 厂商 共享 信息 。 TE enterprises 子 树 下 面 , 每 个 注册 了 enterprise 对 象 标识 符 的 厂商 
有 一 个 分 支 。 

Internet 节点 之 下 分 为 4 个 子 树 的 做 法 为 MIB 的 进化 提供 了 很 好 的 基础 。 通 过 对 新 对 象 
的 实验 ， 厂 商 能 够 在 其 被 接受 为 mgmt 的 标准 之 前 有 效 地 获得 大 量 的 实际 知识 。 因 此 这 样 的 
MIB 既是 对 管理 符合 标准 的 对 象 直接 有 效 的 ， 对 适应 技术 和 产品 的 变化 也 是 灵活 的 。 这 一 点 
也 反映 了 TCP/IP 协议 的 如 下 特性 : 协议 在 成 为 标准 之 前 进行 大 量 的 实验 性 的 使 用 和 调 测 。 

2. 对 象 句法 

SNMP MIB 中 的 每 个 对 象 都 由 一 个 形式 化 的 方法 定义 ， 说 明 对 象 的 数据 类 型 、 取 值 范围 
以 及 与 MIB 中 的 其 他 对 象 的 关系 。 各 个 对 象 以 及 MIB 的 整体 结构 都 由 ASN.1 描述 法 定义 。 
为 了 保持 简单 ， 只 利用 了 ASN.1 的 元 素 和 特征 的 一 个 有 限 的 子 集 。 

(1) UNIVERSAL 类 型 : ASN.1 的 UNIVERSAL 类 由 独立 于 应 用 的 通用 数据 类 型 组 成 。 

其 中 只 有 以 下 数据 类 型 被 允许 用 于 定义 MIB 对 象 : 

口 integer (UNIVERSAL 2)。 

O octetstring (UNIVERSAL 4). 
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口 
口 
口 


null (UNIVERSAL 5). 
object identifier (UNIVERSAL 6). 
sequence, sequence-of (UNIVERSAL 16). 


前 3 个 是 构成 其 他 对 象 类 型 的 基本 类 型 。 
object identifier 惟一 标识 对 象 的 符号 ， 由 一 个 integer 序列 组 成 ,序列 中 的 integer 被 称 为 
子 标识 符 。 对 象 标识 符 的 integer 序列 从 左 到 右 ， 定 义 了 对 象 在 MIB 树 型 结构 中 的 位 置 。 
sequence 和 sequence-of 用 于 构成 表 。 
(2) APPLICATION-WIDE 类 型 : ASN.1 的 APPLICATION 类 由 与 特定 的 应 用 相关 的 数 
据 类 型 组 成 。 每 个 应 用 包括 SNMP， 负 责 定义 自己 的 APPLICATION 数据 类 型 。 在 SNMP 中 


已 经 定义 了 以 下 数据 类 型 : 
O networkaddress: 该 类 型 用 CHOICE 结构 定义 ， 人 允许 从 多 个 协议 族 的 地 址 格式 中 进 
行 选择 。 目 前 ， 只 定义 了 IpAddress 一 种 地 址 格式 。 
O ipaddress: 卫 格 式 的 32 位 地 址 。 
counter: 只 能 做 增值 不 能 做 减 值 运算 的 非 负 整数 。 最 大 值 被 设 为 22 -1， 当 达到 最 


口 


大 值 时 ， 再 次 从 0 开始 增加 。 

gauge: 可 做 增值 也 可 做 减 值 运算 的 非 负 整数 。 最 大 值 被 设 为 2? -1， 当 达到 最 大 值 
时 被 锁定 ， 直 至 被 复位 (rese. 

timeticks: 从 某 一 参照 时 间 开 始 以 百 分 之 一 秒 为 单位 计算 经 历 的 时 间 的 非 负 整数 。 
当 MIB 中 定义 的 某 个 对 象 类 用 到 这 个 数据 类 型 时 , 参照 时 间 在 该 对 象 类 的 定义 中 指 
出 。 

opaque: 该 数据 类 型 提供 一 个 传递 任意 数据 的 能 力 。 数 据 在 传输 时 被 作为 OCTET 
STRING 编码 。 被 传递 的 数据 本 身 可 以 是 由 ASN.1 或 其 他 句法 定义 的 任意 的 格式 。 


3. 定义 对 象 

管理 信息 库 由 一 个 对 象 的 集合 构成 ， 每 个 对 象 都 有 一 个 型 和 一 个 值 。 型 是 对 被 管 对 象 种 
类 的 定义 ， 因 此 型 的 定义 是 一 个 句法 描述 。 对 象 的 实例 是 某 类 对 象 的 一 个 具体 实现 ， 具 有 一 
个 确定 的 值 。 

怎样 定义 MIB 中 的 对 象 呢 ? ASN.1 是 将 被 使 用 的 描述 法 .ASN.1 中 包含 一 些 预定 义 的 通 
用 类 型 ， 也 规定 了 通过 现 有 类 型 定义 新 类 型 的 语法 。 定 义 被 管 对 象 的 一 个 可 选 方法 是 定义 一 
个 被 称 为 Object 的 新 类 型 。 这 样 ，MIB 中 所 有 的 对 象 都 将 是 这 种 类 型 的 。 这 个 方法 在 技术 上 
是 可 行 的 ， 但 会 产生 定义 不 便于 应 用 的 问题 。 我 们 需要 多 种 值 的 类 型 ， 包 括 counter, gauge 
等 。 另 外 ，MIB 支持 二 维 表格 或 矩阵 的 定义 。 因 此 ， 一 个 通用 的 对 象 类 型 必须 包含 参数 来 对 
应 所 有 这 些 可 能 性 和 选择 性 。 


另 一 


个 更 有 吸引 力 的 方法 ， 并 且 也 是 被 SNMP 所 实际 采用 的 方法 是 利用 宏 (macro) 对 


在 被 管 对 象 定义 中 相互 关联 的 类 型 进行 集合 定义 。 一 个 宏 的 定义 给 出 相关 类 型 集合 的 句法 ， 
而 宏 的 实例 定义 一 个 特定 的 类 型 。 因 此 定义 被 分 为 以 下 等 级 : 


口 
口 
口 


宏 : 定义 合法 的 宏 实 例 ， 即 说 明 相关 集合 类 型 的 句法 。 
宏 实例 : 通过 为 宏 定义 提供 实际 参数 生成 实例 ， 即 说 明 一 个 特定 的 类 型 。 
宏 实 例 值 ， 用 一 个 特定 的 值 来 表示 一 个 特定 的 实体 。 


以 下 是 OBJECT-TYPE 宏 的 定义 〈 引 自 RFC 1212) 。 
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OBJECT-TYPE MACRO 
BEGIN 
TYPE NOTATION ::= 


-- must conform to 
-- RFC1155's ObjectSyntax 
"SYNTAX" type (ObjectSyntax) 
"ACCESS" Access 
"STATUS" Status 
DescrPart 
ReferPart 
IndexPart 
DefValPart 
VALUE NOTATION ::= value (VALUE ObjectName) 


Access ::= "read-only" 

| "read-write" 

| "write-only" 

| "not-accessible" 
Status ::- "mandatory" 

| "optional" 

| "obsolete" 

| "deprecated" 


DescrPart 


"DESCRIPTION" value (description DisplayString) 
| empty 


ReferPart ::- 
"REFERENCE" value (reference DisplayString) 
| empty 


IndexPart 


"INDEX" "(" IndexTypes ")" 
| empty 
IndexTypes ::- 
IndexType | IndexTypes "," IndexType 
IndexType ::- 


-- if indexobject, use the SYNTAX 
-- value of the correspondent 
-- OBJECT-TYPE invocation 
value (indexobject ObjectName) 
-- otherwise use named SMI type 
-- must conform to IndexSyntax below 
| type (indextype) 


DefValPart ::= 
"DEFVAL" "{" value (defvalue ObjectSyntax) "}" 
| empty 
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END 


2 目 是 : 

SYNTAX: 对 象 类 的 抽象 句法 ， 该 句法 必须 从 SMI 的 对 象 句法 类 型 中 确定 一 种 
类 型 。 

O ACCESS: 定义 通过 SNMP 或 其 他 协议 访问 对 象 实例 的 方法 。Access 子 句 定义 该 对 
象 类 型 支持 的 最 低 等 级 。 可 选 的 等 级 有 read-only、read-write write-only 和 
not-accessible. 

O STATUS: 指出 该 对 象 在 实现 上 的 要 求 。 要 求 可 以 是 mandatory CH), optional (可 
Æ), deprecated 〈 奶 求 一 一 必须 实现 的 对 象 ， 但 很 可 能 在 新 版 MIB 中 被 删除 ) 和 
obsolete (废除 一 一 不 再 需要 被 管 系统 实现 的 对 象 )。 

D) DescrPart: 对 象 类 型 语义 的 文本 描述 。 该 子 句 是 可 选 的 。 

O ReferPart: 对 定义 在 其 他 MIB. 模块 中 的 某 个 对 象 的 文本 型 交叉 引用 。 该 子 句 是 可 
选 的 。 

O IndexPart: 用 于 定义 表 。 该 子 句 只 是 在 对 象 类 型 对 应 表 中 的 “ 行 ” 时 才 出 现 。 

O DefValPart: 定义 一 个 默认 值 ， 用 于 建立 对 象 实例 。 该 子 句 是 可 选 的 。 

O VALUE NOTATION: 指出 通过 SNMP 访问 该 对 象 时 使 用 的 名 字 。 

由 于 应 用 OBJECT-TYPE 宏 的 MIB 的 完整 的 定义 包含 在 MIB 的 元 长 的 文档 中 ， 因 此 ， 

人 们 并 不 常 使 用 它们 。 比 较 常 用 的 更 简捷 的 方法 一 一 基于 树 型 结构 和 对 象 特性 的 表格 表示 的 
方法 。 
4. 定义 表格 
SMI 只 支持 一 种 数据 结构 化 方法 ， 即 标量 值 条 目的 二 维 表 格 。 表 格 的 定义 用 到 ASN.1 
的 sequence 和 sequence of 两 个 类 型 和 OBJECT-TYPE 宏 中 的 IndexPart。 

表格 定义 方法 可 以 通过 实例 进行 说 明 。 考 虑 对 象 类 型 ttpConnTable， 这 个 对 象 包含 由 相 
应 的 被 管 实体 维护 的 TCP connections 的 信息 。 对 于 每 个 这 样 的 connection， 以 下 信息 在 表 中 
存储 : 
state: TCP connection 的 状态 。 
local address: 该 connection 的 本 端的 卫 地 址 。 
local port: 该 connection 的 本 端的 TCP ži O o 
remote address: 该 connection 的 另 一 端的 也 地 址 。 
remote port: 该 connection 的 另 一 端的 TCP 端口。 

需要 注意 的 是 , tcpConnTable 是 存放 在 某 个 被 管 系统 维护 的 MIB 中。 因此 , tepConnTable 
中 的 一 个 条 目 对 应 被 管 系统 中 的 一 个 connection 的 状态 信息 。TCP connection 的 状态 信息 有 
22 个 项 目 ， 按 照 ttpConnTable HEX, RAER 5 个 项 目 对 网 络 管理 者 来 说 是 可 见 的 。 这 
也 体现 了 SNMP 强调 保持 网 络 管理 简单 性 的 特点 。 即 在 被 管 对象 中 ， 只 包含 相对 应 的 被 管 实 
体 的 有 限 的 和 有 用 的 信息 。 

以 下 给 出 了 tepConnTable 的 定义 〈 引 自 RFC1213) 。 


DOODOOODO 


tcpConnTable OBJECT-TYPE 
SYNTAX SEQUENCE OF TcpConnEntry 
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ACCESS not-accessible 
STATUS mandatory 
DESCRIPTION 
"A table containing TCP connection-specific 
information." 
zie % top 13 } 
tcpConnEntry OBJECT-TYPE 
SYNTAX TcpConnEntry 
ACCESS not-accessible 
STATUS mandatory 
DESCRIPTION 
"Information about a particular current TCP 
connection. An object of this type is transient, 
in that it ceases to exist when (or soon after) 
the connection makes the transition to the CLOSED 
state." 
INDEX { tcpConnLocalAddress, 
tcpConnLocalPort, 
tcpConnRemAddress, 
tcpConnRemPort } 
::= ( tcpConnTable 1 } 
TcpConnEntry ::= 
SEQUENCE { 
tcpConnState 
INTEGER, 
tcpConnLocalAddress 
IpAddress, 
tcpConnLocalPort 
INTEGER (0..65535), 
tcpConnRemAddress 
IpAddress, 
tcpConnRemPort 
INTEGER (0..65535) 
} 


以 上 可 以 看 到 sequence 和 sequence of 在 定义 表格 时 的 应 用 : 
C) “整个 表 由 一 个 SEQUENCE OF TepConnEntry 构成 。ASN.1 的 结构 SEQUENCE OF 
由 一 个 或 多 个 相同 的 元 素 构 成 ， 在 本 例 中 (在 所 有 的 SNMP SMI 的 情况 下 ) 每 个 元 
素 是 表 中 的 一 行 。 
口 每 一 行 由 一 个 指定 了 五 个 标量 元 素 的 SEQUENCE 构成 。 ASN.1 的 结构 SEQUCECE 
由 固定 数目 的 元 素 组 成 , 元 素 的 类 型 可 以 是 多 种 。 RE ASN. 允许 这 些 元 素 是 可 选 
的 ， 但 SMI 限制 这 个 结构 只 能 使 用 “mandatory” 元 素 。 在 本 例 中 ， 每 一 行 所 包含 
的 元 素 的 类 型 是 INTEGER, IpAddress, INTEGER, IpAddress, INTERGE。 
tcpConnEntry 定义 中 的 INDEX 成 分 确定 哪个 对 象 值 将 被 用 于 区 分 表 中 的 各 行 。 在 TCP 
tB, —^ socket CIP 地 址 ，TCP 端口 ) 可 以 支持 多 个 connection， 而 任意 一 对 sockets 之 间 同 
时 只 能 有 一 个 connection。 因 此 为 了 明确 的 区 分 各 行 ， 每 行 中 的 后 四 个 元 素 是 必要 的 ， 也 是 
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m 14.2.2 MIB-II 


在 TCP/IP 网 络 管理 的 建议 标准 中 ， 提 出 了 多 个 相互 独立 的 MIB， 其 中 包含 为 Internet 
的 网 络 管理 而 开发 的 MIB-I。 鉴 于 它 在 说 明 标准 MIB 的 结构 、 作 用 和 定义 方法 等 方面 的 重 
要 性 和 代表 性 ， 有 必要 对 其 进行 比较 深入 的 讨论 。 

MIB-II 是 在 MIB-I 的 基础 之 上 开发 的 ， 是 MIB-I 的 一 个 超 集 。MIB-II 组 被 分 为 以 下 分 组 : 
system: 关于 系统 的 总 体 信息 。 
interface: 系统 到 子 网 接口 的 信息 。 
at (address translation): 描述 internet 到 subnet 的 地 址 映射 。 
ip: 关于 系统 中 IP 的 实现 和 运行 信息 。 
icmp: 关于 系统 中 ICMP 的 实现 和 运行 信息 。 
tcp: 关于 系统 中 TCP 的 实现 和 运行 信息 。 
udp: 关于 系统 中 UDP 的 实现 和 运行 信息 。 
egp: 关于 系统 中 EGP 的 实现 和 运行 信息 。 
dot3 (transmission): 有 关 每 个 系统 接口 的 传输 模式 和 访问 协议 的 信息 。 
snmp: 关于 系统 中 SNMP 的 实现 和 运行 信息 。 

l. system 组 

system 组 提供 有 关 被 管 系统 的 总 体 信息 。 表 14.1 列 出 了 该 组 中 各 个 对 象 的 名 称 、 句 法 、 
访问 权限 和 对 象 描述 。 


üQaaaaaaaauo 


表 14.1 system 组 中 的 对 象 

Description 

DisplayString 
SIZE(0 ... 255) 


DisplayString 
(SIZE(0 ... 255) 

DisplayString 
(SIZE(0 ... 255)) 

DisplayString 
(SIZE(0 ... 255)) 


sysContect 


该 被 管 节点 被 赋予 的 名 称 


sysName 


该 节点 的 物理 地 点 


指出 该 节点 所 提供 的 服务 的 集合 ，7 个 bit 对 
应 7 层 服务 


sysLocation 


sysService INERGER(0 ... 127) 


2. interfaces 组 
interfaces 组 包含 实体 物理 接口 的 一 般 信 息 , 包括 配置 信息 和 各 接口 中 所 发 生 的 事件 的 统 
计 信 息 。 表 14.2 列 出 了 该 组 中 各 个 对 象 的 名 称 、 句 法 、 访 问 权 限 和 对 象 描述 。 
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表 14.2 interfaces 组 中 的 对 象 


Object Syntax Description 
ifNumber INTEGER RO | 网 络 接口 的 数目 
ifTable SEDUBNCR OF! wa | 接口 条 目 清单 

ifEntry 
ifEntry SEQUENCE NA | 包含 子 网 及 其 以 下 层 对 象 的 接口 条 目 
iffndex INTEGER RO | 对 应 各 个 接口 的 惟一 值 
DisplayString Ho 有 关 接 口 的 信息 ， 包 括 厂 商 、 产 品名 称 、 硬 件 接 
(SIZE(0 .… 255)) 口 版 本 

ifType INTEGER RO 接口 类 型 ， 根 据 物 理 或 链 路 层 协议 区 分 
ifMtu INERGER 接口 可 接收 或 发 送 的 最 大 协议 数据 单元 的 尺寸 
ifSpeed Gauge RO _| 接口 当前 数据 速率 的 估计 值 
ifPhysAddress — | PhysAddress | no | 网 络 层 之 下 协议 层 的 接口 地 址 
ifAdminstaus — | INTEGER 期 望 的 接口 状态 (up(1), down(2), testing(3)) 
ifOperStatus INTEGER | go | 当前 的 操作 接口 状态 (up(D, downQ). testing) 
ifLastChange TimeTicks | Ro | 接口 进入 当前 操作 状态 的 时 间 
iffnOctets Counter | no | 接口 收 到 的 8 元 组 的 总 数 
iffnUcastPkts Counter | RO | 递交 到 高 层 协议 的 子 网 单 播 的 分 组 数 
iflnNUcastPkts Counter | ro | 递交 到 高 层 协议 的 非 单 播 的 分 组 数 
iffnDiscards Counter | ro | 被 丢弃 的 进 站 分 组 数 
ifInErrors Counter | ro | 有 错 的 进 站 分 组 数 
iffnUnkownProtos | Counter | ro | 由 于 协议 未 知 而 被 丢弃 的 分 组 数 
ifOutOctets Counter | ro | 接口 发 送 的 8 元 组 的 总 数 
ifOutUcastPkts Counter | ro | 发 送 到 子 网 单 播 地 址 的 分 组 总 数 
ifOutNUcastPkts _| Counter | RO | 发 送 到 非 子 网 单 播 地 址 的 分 组 总 数 
ifOutDiscards Counter | ro | 被 丢弃 的 出 站 分 组 数 
ifOutErrors Counter | mo | 不 能 被 发 送 的 有 错 的 分 组 数 
ifOutQLen Gauge | Ro | 输出 分 组 队列 长 度 
ifSpecific OBJECT IDENTIFIER | RO | 参考 MIB 对 实现 接口 的 媒体 的 定义 


3. address translation 组 

address translation 组 由 一 个 表 构成 ， 表 中 的 每 一 行 对 应 系统 中 的 一 个 物理 接口 ， 提 供 网 
络 地 址 向 物理 地 址 的 映射 。 一 般 情 况 下 ,网络 地 址 是 指 系统 在 该 接口 上 的 IP 地 址 ， 而 物理 地 
址 决定 于 实际 采用 的 子 网 情况 。 例 如 ， 如 果 接 口 对 应 的 是 LAN， 则 物理 地 址 是 接口 的 MAC 
地 址 ， 如 果 对 应 X.25 分 组 交换 网 ， 则 物理 地 址 可 能 是 一 个 X.121 地 址 。 表 14.3 列 出 了 该 组 
中 各 个 对 象 的 名 称 、 名 法、 访问 权限 和 对 象 描述 。 


#214.3 address translation 组 中 的 对 象 


Object Syntax 
atTable | SEQUENCE OF AtEntry 
atEnt SEQUENCE 


Description 
包含 网 络 地 址 对 物理 地 址 的 映射 
包含 一 个 网 络 地 址 、 物 理 地 址 对 
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Description 
表格 条 目的 索引 
依赖 媒体 的 物理 地 址 
对 应 物理 地 址 的 网 络 地 址 


atIfIndex. INTEGER 
atPhysAddress | PhysAddress 
atNetAddress NetworkAddress 


实际 上 ，address translation 组 包含 在 MIB-II 中 只 是 为 了 与 MIB-I 兼 容 , MIB-II 的 地 址 转 
换 信息 在 各 个 网 络 协议 组 中 提供 。 

4. ipf 

ip 组 包含 有 关节 点 上 IP 实现 和 操作 的 信息 ， 如 有 关 IP 层 流 量 的 一 些 计数 器 。ip 组 中 包 
含 三 个 表 ，ipAddrTable、ipRouteTable 和 ipNetToMediaTable. 

ipAddrTable 包含 分 配给 该 实体 的 他 地 址 的 信息 , 每 个 地 址 被 惟一 分 配给 一 个 物理 地 址 。 

ipRouteTable 包含 用 于 互联 网 路 由 选择 的 信息 。 该 路 由 表 中 信息 是 比较 原本 地 从 一 些 协 
议 的 路 由 表 中 抽取 而 来 的 。 实 体 当 前 所 知 的 每 条 路 由 都 有 一 个 条 目 ， 表 格 由 ipRouteDest 索 
引 。ipRouteTable 中 的 信息 可 用 于 配置 的 监测 ， 并 且 由 于 表 中 的 对 象 是 read-write 的 ， 因 此 也 
可 被 用 于 路 由 控制 。 

ipNetToMediaTable 是 一 个 提供 IP 地 址 和 物理 地 址 之 间 对 应 关系 的 地 址 转换 表 。 除 了 增 
加 一 个 指示 映射 类 型 的 对 象 ipNetToMediaType 之 外 , 表 中 所 包含 的 信息 与 address translation 
组 相同 。 

此 外 , ip 组 中 还 包含 一 些 用 于 性 能 和 故障 监测 的 标量 对 象 。 表 14.4 列 出 了 该 组 中 各 个 对 
象 的 名 称 、 名 法、 访问 权限 和 对 象 描述 。 


表 14.4 ip 组 中 的 对 象 


Object Syntax Access Description 
ipForwarding INTEGER 是 否 作为 他 网 关 (1/0) 
euam | mma | ow [SASMSBAREETH Y 3T 
ipInReceives Counter | ro | 接口 收 到 的 输入 数据 报 的 总 数 
ipInHdrErrors. Counter RO 由 于 IP 头 错 被 丢弃 的 输入 数据 报 总 数 
ipInAddrErrors Counter RO |HrT 耳 地 址 错 被 丢弃 的 输入 数据 报 总 数 
ipForwDatagrams Counter RO | 转发 的 输入 数据 报 数 
ipInUnknownProtos Counter RO 由 于 协议 未 知 被 丢弃 的 输入 数据 报 数 
ipInDiscards Counter RO | 无 适当 理由 而 被 丢弃 的 输入 数据 报 数 
ipInDelivers Counter 成 功 地 递交 给 IP 用 户 协议 的 输入 数据 报 数 
ipOutRequests Counter 本 地 IP 用 户 协 议 要 求 传 输 的 人 P 数 据 报 总 数 
ipOutNoRoutes Counter 由 于 未 找到 路 由 而 被 丢弃 的 他 数据 报 数 
ipReasmTimeOut INTEGER 重组 接收 到 的 碎片 可 等 待 的 最 大 秒 数 
ipReasmReqds Counter 接收 到 的 需要 重组 的 IP EA RL 
ipReasmOKs Counter 成 功 重组 的 IP 数据 报 数 
ipRaesmFails Counter 由 耳 重 组 算法 检测 到 的 重组 失败 的 数目 
ipFragsOk Counter | Ro | 成 功 拆 分 的 耳 数据 报 数 
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续 表 

Object Syntax Description 
ipFragsFails Counter 不 能 成 功 拆 分 而 被 丢弃 的 卫 数据 报 数 
ipFragsCreates Counter 本 实体 产生 的 IP 数据 报 碎片 数 
SEQUENCE OF 本 实体 的 他 地 址 信息 
We IpAddrEntry ( 表 内 对 象 略 ) 
z SEQUENCE OF I 卫 路 由 表 
sas a | pRouteEntry ( 表 内 对 象 略 ) 
. SEQUENCE OF 用 于 将 人 P 映射 到 物理 地 址 的 地 址 转换 表 
ipNetToMediaTable IpNetToMedis Ent ( 表 内 对 象 略 ) 
IpRouting Discards | Counter 被 丢弃 的 路 由 选择 条 目 


5. icmp 组 

ICMP (Internet Control Message Protocol) 是 TCP/IP 协议 族 中 的 一 部 分 ， 所 有 实现 他 协 
议 的 系统 都 提供 ICMP. ICMP 提供 从 路 由 器 或 其 他 主机 向 主机 传递 消息 的 手段 , 它 的 基本 作 
用 是 反馈 通信 环境 中 存在 的 问题 ， 例 如 : 数据 报 不 能 到 达 目 的 地 ， 路 由 器 没有 缓冲 区 容量 来 
转发 数据 报 。 

icmp 组 包含 有 关 一 个 节点 的 ICMP 的 实现 和 操作 的 信息 ， 具 体 地 讲 ，icmp 组 由 节点 接 
收 和 发 送 的 各 种 ICMP 消息 的 计数 器 所 构成 的 。 表 14.5 列 出 了 该 组 中 各 个 对 象 的 名 称 、 句 法 、 
访问 权限 和 对 象 描述 。 


表 14.5 icmp 组 中 的 对 象 


Object | Syntax — | Access | Description 
icmpInMsgs | Comer | RO [| 收 到 的 ICMP 消息 的 总 数 
icmpInErrors | comer | mo [| 收 到 的 有 错 的 ICMP 的 消息 数 


icmpInDestUnreachs | comer | mo | 收 到 的 目的 地 不 可 到 达 的 消息 数 
icmpInTimeExcds | comer | ro | 收 到 的 超时 的 消息 数 
icmplnParmProbs 收 到 的 有 参数 问题 的 消息 数 


| RO | 
icmplnSrcQuenchs | come | mo | 收 到 的 源 有 问题 的 消息 数 
| ro | 


icmpInRedirects 收 到 的 重 定向 的 消息 数 
icmpInEchos Counter RO 收 到 的 要 求 echo 的 消息 数 
icmpInEchoReps Counter RO 收 到 的 应 答 echo 的 消息 数 
icmpInTimestamps Counter RO 收 到 的 要 求 Timestamp 的 消息 数 
icmpInTimestampReps Counter RO 收 到 的 应 答 Timestamp 的 消息 数 
icmpInAddrMasks Counter RO 收 到 的 要 求 Address Mask 的 消息 数 
icmpInAddrMaskReps Counter RO 收 到 的 应 答 Address Mask 的 消息 数 
icmpOutMsgs Counter RO 发 出 的 ICMP 消息 的 总 数 
icmpOutErrors Counter RO 发 出 的 有 错 的 ICMP 的 消息 数 
icmpOutDestUnreachs RO 发 出 的 目的 地 不 可 到 达 的 消息 数 
icmpOutTimeExcds RO 发 出 的 超时 的 消息 数 
icmpOutParmProbs RO 发 出 的 有 参数 问题 的 消息 数 
icmpOutSrcQuenchs RO 发 出 的 源 有 问题 的 消息 数 
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Description 


icmpOutRedirects Counter 发 出 的 重 定向 的 消息 数 
icmpOutEchos Counter 发 出 的 要 求 echo 的 消息 数 
icmpOutEchoReps Counter 发 出 的 应 答 echo 的 消息 数 
icmpOutTimestamps Counter 发 出 的 要 求 Timestamp 的 消息 数 
icmpOutTimestampReps Counter 发 出 的 应 答 Timestamp 的 消息 数 
icmpOutAddrMasks Counter 发 出 的 要 求 Address Mask 的 消息 数 


6. tcp 组 


icmpOutAddrMaskReps Counter 


发 出 的 应 答 Address Mask 的 消息 数 


tcp 组 包含 有 关 一 个 节点 的 TCP 的 实现 和 操作 的 信息 ， 以 上 定义 的 tepConnTable 包含 在 
这 个 组 中 。 表 14.6 列 出 了 该 组 中 各 个 对 象 的 名 称 、 名 法、 访问 权限 和 对 象 描述 。 


表 14.6 tcp 组 中 的 对 象 


Object Syntax Description 

tepRtoAlgorithm | INTEGER | Ro | 重 传 时 间 
tcpRtoMin INTEGER | Ro | 重 传 时 间 的 最 小 值 
tcpRtoMax INTEGER | Ro | 重 传 时 间 的 最 大 值 
tcpMaxConn | INTEGER | Ro | 实体 支持 的 TOP 连接 数 的 上 限 
tcpActiveOpens | Counter | no | 实体 已 经 支持 的 主动 打开 的 数量 
tepPassiveOpens_| Counter | mo | 实体 已 经 支持 的 被 动 打开 的 数量 
tepAttemptFails | Counter | Ro | 已 经 发 生 的 试 连 失败 的 次 数 
tcpEstabResets — | Counter | Ro | 已 经 发 生 的 复位 的 次 数 
tepCurrEstab Gauge | Ro | 当前 状态 为 established 的 TCP 连接 数 
tcpInSegs Counter | mo | 收 到 的 segments 总 数 
tcpOutSegs Counter | ro | 发 出 的 segments 总 数 
tcpRetranSegs Counter | mo | 重 传 的 segments 总 数 
tcpConnTable SEQUENCE OF TcpConnEntry NA z oe e PERRA 
tcpInErrors Counter RO | 收 到 的 有 错 的 segments 的 总 数 
tcpOutRsts Counter RO 发 出 的 含有 RST 标志 的 segments 数 

7. udp 组 


udp 组 包含 有 关 一 个 节点 的 UDP 的 实现 和 操作 的 信息 .除了 有 关 发 送 和 接收 的 数据 报 的 信 
息 之 外 ， 这 个 组 中 还 包含 一 个 udpTable 表 ， 该 表 中 包含 UDP 端点 的 管理 信息 。 所 谓 UDP 端点 
是 指正 在 支持 本 地 应 用 接收 数据 报 的 UDP 进程 。udpTable 表 中 包含 每 个 UDP 端点 用 户 的 IP 
地 址 和 UDP 端口 。 表 14.7 列 出 了 该 组 中 各 个 对 象 的 名 称 、 名 法、 访问 权限 和 对 象 描述 。 


表 14.7 udp 组 中 的 对 象 


Object Syntax Access Description 
udpInDatagram Counter RO 递交 该 UDP 用 户 的 数据 报 的 总 数 
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Description 
收 到 的 目的 端口 上 没有 应 用 的 数据 报 总 数 


udpNoPorts 


udpInErrors Counter 收 到 的 无 法 递交 的 数据 报 数 
udpOutDatagrams | Counter 该 实体 发 出 的 UDP 数据 报 总 数 
udpTable | SEQUENCE OF UdpEntry 包含 UDP 的 用 户 信息 
udpTable | SEQUENCE 某 个 当前 UDP 用 户 的 信息 
udpLocalAddress | IpAddress UDP 用 户 的 本 地 IP 地 址 
udpLocalPort INTEGER UDP 用 户 的 本 地 端口 号 


8. egp 组 
egp 组 包含 有 关 一 个 节点 的 EGP (External Gateway Protocol) 的 实现 和 操作 的 信息 。 除 


了 有 关 发 送 和 接收 的 EGP 消息 的 信息 之 外 ， 这 个 组 中 还 包含 一 个 egpNeighTable 表 ， 该 表 中 
包含 有 关 相 邻 网 关 的 信息 。 表 14.8 列 出 了 该 组 中 各 个 对 象 的 名 称 、 句 法、 访问 权限 和 对 象 描 
述 。 


表 14.8 egp 组 中 的 对 象 


| smtax | Access | Description 
[counter — — — — — — [| mo | 收 到 的 无 错 的 EGP 消息 数 
| Counter | mo | 收 到 的 有 错 的 EGP 消息 数 
egpOutMsgs | Counter | RO | 本 地 产生 的 EGP 消息 总 数 


由 于 资源 限制 没有 发 出 的 本 地 产生 的 EGP 
消息 数 
相 邻 网 关 的 EGP 表 〈 表 内 的 对 象 略 ) 
本 EGP 实体 的 自治 系统 数 


egpOutErrors 


egpNeighTable 


fam | to | 


SEQUENCE OF EgpNeighEnt 


INTEGER 


14.3 简单 网 络 管理 协议 


14.3.1 SNMP 支持 的 操作 


SNMP 只 支持 对 变量 的 检查 和 修改 的 操作 ， 具 体 地 可 以 对 标量 对 象 进行 以 下 3 种 操作 。 

O Get. 管理 站 从 被 管理 站 提取 标量 对 象 值 。 

O Set 管理 站 更 新 被 管理 站 中 的 标量 对 象 值 。 

O Trap: 被 管理 站 向 管理 站 主动 地 发 送 一 个 标量 对 象 值 。 

MIB 的 结构 不 能 通过 增加 或 减少 对 象 实例 被 改变 , 并 且 , 访问 只 能 对 对 象 标 识 树 中 的 叶 
子 对 象 进行 。 这 些 限 制 大 大 简化 了 SNMP 的 实现 ， 但 同时 也 限制 了 网 络 管理 系统 的 能 力 。 
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14.3.2 ”共同 体 和 安全 控制 


网 络 管理 是 一 种 分 布 式 的 应 用 。 与 其 他 分 布 式 的 应 用 相同 ， 网 络 管理 中 包含 由 一 个 应 用 
协议 支持 的 多 个 应 用 实体 的 相互 作用 。 在 SNMP 网 络 管理 中 ,这 些 应 用 实体 就 是 采用 SNMP 
的 管理 站 应 用 实体 和 被 管理 站 的 应 用 实体 。 

SNMP 网 络 管理 具有 一 些 不 同 于 其 他 分 布 式 应 用 的 特性 ， 它 包含 一 个 管理 站 和 多 个 被 管 
理 站 之 间 一 对 多 的 关系 。 即 管理 站 能 够 获取 和 设置 各 管理 站 的 对 象 ， 能 够 从 各 被 管理 站 中 接 
收 陷阱 信息 。 因 此 ， 从 操作 或 控制 的 角度 来 看 ， 管 理 站 管理 着 多 个 被 管理 站 。 同 时 ， 系 统 中 
也 可 能 有 多 个 管理 站 ， 每 个 管理 站 都 管理 所 有 的 或 一 部 分 被 管理 站 。 

反 过 来 , 我 们 也 要 看 到 SNMP 网 络 管理 中 还 包含 另外 一 种 一 对 多 的 关系 一 一 一 个 被 管理 
站 和 多 个 管理 站 之 间 的 关系 。 每 个 被 管理 站 控制 着 自己 的 本 地 MIB， 同 时 必须 能 够 控制 多 个 
管理 站 对 这 个 本 地 MIB 的 访问 。 这 里 所 说 的 控制 有 以 下 三 个 方面 : 

O WERS: 将 对 MIB 的 访问 限定 在 授权 的 管理 站 的 范围 内 。 

D) 访问 策略 : 对 不 同 的 管理 站 给 予 不 同 的 访问 权限 。 

O RERS: 一 个 被 管理 站 可 以 作为 其 他 一 些 被 管理 站 〈 托 管 站 ) 的 代 管 ， 这 就 要 求 

在 这 个 代 管 系统 中 实现 为 托管 站 服务 的 认证 服务 和 访问 权限 。 

以 上 这 些 控制 都 是 为 了 保证 网 络 管理 信息 的 安全 , 即 被 管 系统 需要 保护 它们 的 MIB 不 被 
非法 地 访问 。SNMP 通过 共同 体 (community〉 的 概念 提供 了 初步 的 和 有 限 的 安全 能 力 。 

SNMP 用 共同 体 来 定义 一 个 代理 者 和 一 组 管理 者 之 间 的 认证 、 访 问 控 制 和 代 管 的 关系 。 
共同 体 是 一 个 在 被 管 系统 中 定义 的 本 地 的 概念 。 被 管 系统 为 每 组 可 选 的 认证 、 访 问 控制 和 代 
管 特 性 建立 一 个 共同 体 。 每 个 共同 体 被 赋予 一 个 在 被 管 系统 内 部 惟一 的 共同 体 名 ， 该 共同 体 
名 要 提供 给 共同 体内 的 所 有 的 管理 站 ,以 便 它们 在 get 和 set 操作 中 应 用 。 代 理 者 可 以 与 多 个 
管理 站 建立 多 个 共同 体 ， 同 一 个 管理 站 可 以 出 现在 不 同 的 共同 体 中 。 

由 于 共同 体 是 在 代理 者 处 本 地 定义 的 ， 因 此 不 同 的 代理 者 处 可 能 会 定义 相同 的 共同 体 
名 。 共 同体 名 相同 并 不 意味 着 共同 体 有 什么 相似 之 处 ， 因 此 ， 管 理 站 必须 将 共同 体 名 与 代理 
者 联系 起 来 加 以 应 用 。 

1. 认证 服务 

认证 服务 是 为 了 保证 通信 是 可 信 的 。 在 SNMP 消息 的 情况 下 ， 认 证 服务 的 功能 是 保证 收 
到 的 消息 是 来 自 它 所 声称 的 消息 源 。SNMP 只 提供 一 种 简单 的 认证 模式 : 所 有 由 管理 站 发 向 
代理 者 的 消息 都 包含 一 个 共同 体 名 ， 这 个 名 字 发 挥 口令 的 作用 。 如 果 发 送 者 知道 这 个 口令 ， 
则 认为 消息 是 可 信 的 。 

通过 这 种 有 限 的 认证 形式 , 网 络 管理 者 可 以 对 网 络 监控 (set、 trap) 特别 是 网 络 控制 (set) 
操作 进行 限制 。 共 同体 名 被 用 于 引发 一 个 认证 过 程 ， 而 认证 过 程 可 以 包含 加 密 和 解密 以 实现 
更 安全 的 认证 。 

2. 访问 策略 

通过 定义 共同 体 , 代理 者 将 对 它 的 MIB 的 访问 限定 在 了 一 组 被 选择 的 管理 站 中 。 通 过 使 
用 多 个 共同 体 , 代理 者 可 以 为 不 同 的 管理 站 提供 不 同 的 MIB 访问 控制 。 访问 控制 包含 两 个 方 
面 : 

O SNMP MIB 视图 : MIB 中 对 象 的 一 个 子 集 。 可 以 为 每 个 共同 体 定 义 不 同 的 MIB 视 
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图 ， 视 图 中 的 对 象 子 集 可 以 不 在 MIB 的 一 个 子 树 之 内 。 
O SNMP 访问 模式 : READ-ONLY 或 READ-WRITE， 为 每 个 共同 体 定义 一 个 访问 
模式 。 
MIB 视图 和 访问 模式 的 结合 被 称 为 SNMP 共同 体 轮廓 Cprofile) 。 即 ， 一 个 共同 体 轮廓 
由 代理 者 处 MIB 的 一 个 子 集 加 上 一 个 访问 模式 构成 。SNMP 访问 模式 统一 地 被 用 于 MIB 视 
图 中 的 所 有 对 象 。 因 此 ， 如 果 选 择 了 READ-ONLY 访问 模式 ， 则 管理 站 对 视图 中 的 所 有 对 象 
都 只 能 进行 read-only 操作 。 
事实 上 ， 在 一 个 共同 体 轮 廓 之 内 ， 存 在 两 个 独立 的 访问 限制 一 一 MIB 对 象 定义 中 的 访问 
限制 和 SNMP 访问 模式 。 这 两 个 访问 限制 在 实际 应 用 中 必须 得 到 协调 。 表 14.9 给 出 了 这 两 
个 访问 限制 的 协调 规则 。 注 意 ， 对 象 被 定义 为 write-only，SNMP 也 可 以 对 其 进行 read 操作 。 


表 14.9 ”MIB 对 象 定义 中 的 ACCESS 限制 与 SNMP 访 问 模式 的 关系 
MIB 对 象 定义 中 SNMP 访问 模式 


的 ACCESS 限制 READ-ONLY READ-WRITE 


在 实际 应 用 中 , 一 个 共同 体 轮廓 要 与 代理 者 定义 的 某 个 共同 体 联系 起 来 , 便 构成 了 SNMP 
的 访问 策略 Caccess policy) 。 即 SNMP 的 访问 策略 指出 一 个 共同 体 中 的 MIB 视图 及 其 访问 
模式 。 

3. RERS 

共同 体 的 概念 对 支持 代 管 服务 也 是 有 用 的 。 如 前 所 述 ,在 SNMP 中 ，, 代 管 是 指 为 其 他 设 
备 提供 管理 通信 服务 的 代理 者 。 对 于 每 个 托管 设备 ， 代 管 系统 维护 一 个 对 它 的 访问 策略 ， 以 
此 使 代 管 系统 知道 哪些 MIB 对 象 可 以 被 用 于 管理 托管 设备 和 能 够 用 何 种 模式 对 它们 进行 访 
问 。 


14.3.3 ”实例 标识 


我 们 已 经 看 到 ，MIB 中 的 每 个 对 象 都 有 一 个 由 其 在 树 型 结构 的 MIB. 中 所 处 的 位 置 所 定 
义 的 惟一 的 对 象 标识 符 。 但 是 ， 应 该 注意 到 ，MIB 树 型 结构 给 出 的 对 象 标识 符 在 一 些 情况 下 
只 是 对 象 类 型 的 标识 符 ， 不 能 惟一 地 标识 对 象 的 实例 。 例 如 表格 的 对 象 标识 符 不 能 标识 表格 
中 各 个 条 目 。 由 于 对 MIB 的 访问 是 对 对 象 实例 的 访问 , 因此 各 个 对 象 实例 都 必须 有 惟一 标识 
的 方法 。 

1. 纵 列 对 象 

表 中 的 对 象 被 称 为 纵 列 对 象 。 纵 列 对 象 标识 符 不 能 独自 标识 对 象 实例 ， 因 为 表 中 的 每 一 
行 都 有 纵 列 对 象 的 一 个 实例 。 为 了 实现 这 类 对 象 实例 的 惟一 标识 ，SNMP 实际 定义 了 两 种 技 
AR: 顺序 访问 技术 和 随机 访问 技术 。 顺 序 访问 技术 是 通过 利用 辞典 编排 顺序 实现 的 。 而 随机 
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访问 技术 是 通过 利用 索引 对 象 值 实现 的 。 下 面 首先 讨论 随机 访问 技术 。 

一 个 表格 是 由 零 到 多 个 行 ( 条 目 ) 构成 的 ， 每 一 行 都 包含 一 组 相同 的 标量 对 象 类 型 ， 或 
称 纵 列 对 象 。 每 个 纵 列 对 象 都 有 一 个 惟一 的 标识 符 。 但 由 于 纵 列 对象 可 能 有 多 个 实例 ， 因 此 
纵 列 对 象 标识 符 并 不 能 惟一 标识 它 的 各 个 实例 。 然 而 ， 在 定义 表格 时 ， 一 般 包 含 一 个 特殊 的 
纵 列 对 象 INDEX， 即 索引 对 象 ， 它 的 每 个 实例 都 具有 不 同 的 值 ， 可 以 用 来 标识 表 中 的 各 行 。 
因此 ，SNMP 采用 将 索引 对 象 值 连 接 在 纵 列 对 象 标识 符 之 后 的 方法 来 标识 纵 列 对 象 的 实例 。 

作为 例子 ， 我 们 看 一 下 interfaces 组 中 的 ifTable。 表 中 有 一 个 索引 对 象 iindex， 它 的 值 
是 一 个 1 到 ifNumber 之 间 的 整数 ， 对 应 每 个 接口 ，ifIndex 有 一 个 惟一 的 值 。 现 在 假设 要 获 
取 系统 中 第 2 个 接口 的 接口 类 型 ifType。ifType 的 对 象 标识 符 是 1.3.6.1.2.1.2.2.1.3。 而 第 2 
个 接口 的 ifndex (AE 2。 因 此 对 应 第 2 个 接口 的 ifrype 的 实例 的 标识 符 便 为 
1.3.6.1.2.1.2.2.1.3.2。 即 将 这 个 iffndex 的 值 作为 实例 标识 符 的 最 后 一 个 子 标识 符 加 到 ifType 
对 象 标识 符 之 后 。 

2. 表格 及 行 对象 

对 于 表格 和 行 对 象 ， 没 有 定义 它们 的 实例 标识 符 。 这 是 因为 表格 和 行 不 是 叶子 对 象 ， 因 
而 不 能 由 SNMP 访问 。 在 这 些 对 象 的 MIB 定义 中 , 它们 的 ACCESS 特性 被 设 为 not-accessible。 

3. 标量 对 象 

在 标量 对 象 的 场合 ， 用 对 象 类 型 标识 符 便 能 惟一 标识 它 的 实例 ， 因 为 每 个 标量 对 象 类 型 
只 有 一 个 对 象 实例 。 但 是 ， 为 了 与 表格 对 象 实例 标识 符 的 约定 保持 一 致 ， 也 为 了 区 分 对 象 的 
类 型 和 对 象 实例 ，SNMP 规定 标量 对 象 实例 的 标识 符 由 其 对 象 类 型 标识 符 加 0 组 成 。 


14.3.4 辞典 编纂 式 排序 


对 象 标识 符 是 反映 该 对 象 在 MIB 中 的 树 型 结构 的 一 个 整数 序列 。 给 出 一 个 MIB 的 树 型 
结构 ， 跟 踪 从 root 开始 到 某 个 特定 对 象 的 路 径 ， 便 可 以 得 到 该 对 象 的 对 象 标识 符 。 

由 于 对 象 标识 符 是 一 个 整数 序列 ， 因 此 ， 可 以 把 它们 看 作 是 某 本 书 的 内 容 在 书 中 的 章节 
排序 。 总 排序 可 以 通过 遍历 MIB 中 的 对 象 标识 符 树 来 生成 。 利 用 这 个 总 排序 ， 也 可 以 对 对 象 
实例 进行 惟一 的 标识 。 

因为 网 络 管理 站 对 代理 者 提供 MIB 视图 的 构成 不 一 定 完全 清楚 , 因此 , 它 需 要 一 种 不 必 
提供 对 象 名 称 而 能 访问 对 象 的 方法 。 在 这 种 情况 下 ， 对 象 及 其 实例 的 排序 就 是 非常 重要 的 。 
利用 这 个 排序 , 管理 站 可 以 有 效 地 遍历 一 个 MIB 的 结构 。 因 为 管理 站 只 要 提供 树 型 结构 的 任 
意 一 点 上 的 一 个 对 象 实例 的 标识 符 ， 就 可 以 顺序 地 对 其 后 继 的 对 象 实例 进行 访问 。 


14.3.5 SNMP 消息 格式 


管理 站 和 代理 者 之 间 以 传送 SNMP 消息 的 形式 交换 信息 。 每 个 消息 包含 一 个 指示 SNMP 
版 本 号 的 版 本 号 ， 一 个 用 于 本 次 交换 的 共同 体 名 和 一 个 指出 5 种 协议 数据 单元 之 一 的 消息 类 
型 。 图 14.4 描述 了 这 种 结构 。 表 14.10 对 其 中 的 元 素 进行 了 说 明 。 

1. SNMP 消息 的 发 送 

一 般 情况 下 ， 一 个 SNMP 协议 实体 完成 以 下 动作 向 其 他 SNMP 实体 发 送 PDU: 

O 构成 PDU。 
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D) ”将 构成 的 PDU、 源 和 目的 传送 地 址 以 及 一 个 共同 体 名 传 给 认证 服务 。 认 证 服务 完成 

所 要 求 的 变换 ， 例 如 进行 加 密 或 加 入 认证 码 ， 然 后 将 结果 返回 。 
O SNMP 协议 实体 将 版 本 字段 、 共 同体 名 以 及 上 一 步 的 结果 组 合成 为 一 个 消息 。 fa 
C) 用 基本 编码 规则 (BER)〉 对 这 个 新 的 ASN.1 的 对 象 编码 ， 然 后 传 给 传输 服务 。 


Version Community SNMP PDU 


(a) GetRequest PDU, GetNextRequest PDU, SetRequest PDU 


PDU type request-id o o variable-bindings 


(b) GetRequest-PDU, GetNextRequest-PDU, SetRequest-PDU 


PDUtype | requestid | error-status | error-index | — variable-bindings 


(c) Response PDU 


PDU type| enterprise | agent-addr timp-stamp | variable-bindings 


| specific- 


trap trap 
(d) Trap PDU 
namel | valuel | name2 | value2 Dea namen | valuen 


(e) Variable-bindings 
图 14.4 SNMP 消息 格式 


表 14.10 SNMP 消 息 字段 


字 段 H xk 
version SNMP 版 本 
community 共同 体 的 名 字 用 作 SNMP 认证 消息 的 口令 
request-id 为 每 个 请 求 赋予 一 个 惟一 的 标识 符 
error-status noError(0).tooBig(1).noSuchN: 2).badValue(3).readOnly(4).genEm(5 
error-index 25 error-status 非 0 时 ， 可 以 进一步 提供 信息 指出 哪个 变量 引起 的 问题 
variable-bindings | 变量 名 及 其 对 应 值 清单 
enterprise 生成 trap 的 对 象 的 类 型 
agent-addr 生成 trap 的 对 象 的 地 址 

一 般 的 trap 类 # :coldStart(0),warmStart(1).linkDown(2).linkUp(3). authentication 

nina -Failure(4). egpNeighborl.oss(5).enterprise-Specific(6) 
specific-trap 特定 的 trap 代码 
time-stamp 网 络 实体 从 上 次 启动 到 本 trap 生成 所 经 历 的 时 间 


2. SNMP 消息 的 接收 
一 般 情况 下 ， 一 个 SNMP 协议 实体 完成 以 下 动作 接收 一 个 SNMP 消息 。 
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进行 消息 的 基本 句法 检查 ， 丢 弃 非 法 消息 。 
检查 版 本 号 ， 丢 弃 版 本 号 不 匹配 的 消息 。 
O SNMP 协议 实体 将 用 户 名 、 消 息 的 PDU 部 分 以 及 源 和 目的 传输 地 址 传 给 认证 服务 。 
如 果 认 证 失败 , 认证 服务 通知 SNMP 协议 实体 , 由 它 产生 一 个 trap 并 丢弃 这 个 消息 ， 
如 果 认证 成 功 ， 认 证 服务 返回 SNMP 格式 的 PDU。 
O ”协议 实体 进行 PDU 的 基本 句法 检查 ， 如 果 非 法 ， 丢 弃 该 PDU， 否 则 利用 共同 体 名 
选择 对 应 的 SNMP 访问 策略 ， 对 PDU 进行 相应 处 理 。 
3. 变量 绑 定 
在 SNMP 中 ， 可 以 将 多 个 同类 操作 (eet. set. trap) 放 在 一 个 消息 中 。 如 果 管 理 站 希望 
得 到 一 个 代理 者 处 的 一 组 标量 对 象 的 值 ， 它 可 以 发 送 一 个 消息 请 求 所 有 的 值 ， 并 通过 获取 一 
个 应 答 得 到 所 有 的 值 。 这 样 可 以 大 大 减少 网 络 管理 的 通信 负担 。 
为 了 实现 多 对 象 交换 ， 所 有 的 SNMP 的 PDU 都 包含 了 一 个 变量 绑 定 字段 。 这 个 字段 由 
对 象 实例 的 一 个 参考 序列 及 这 些 对 象 的 值 构成 。 某 些 PDU 只 需 给 出 对 象 实例 的 名 字 ， 如 get 
操作 。 对 于 这 样 的 PDU， 接 收 协议 实体 将 忽略 变量 绑 定 字 段 中 的 值 。 


14.3.6 GetRequest PDU 


SNMP 实体 应 网 络 管理 站 应 用 程序 的 请 求 发 出 GetRequest PDU。 发 送 实体 将 以 下 字段 包 
含 在 PDU 之 中 : 
O PDU 类 型 指出 GetRequest PDU 类 型 。 
O request-id: Request-id 能 够 使 SNMP 应 用 将 得 到 的 各 个 应 答 与 发 出 的 各 个 请 求 一 一 
对 应 起 来 。 同时 也 可 以 使 SNMP 实体 能 够 处 理由 于 传输 服务 的 问题 而 产生 的 重复 的 
PDU. 
O variablebindings: 要 求 获取 值 的 对 象 实例 清单 。 
GetRequest PDU 的 SNMP 接收 实体 用 包含 相同 request-id 的 GetResponse PDU 进行 应 
答 。GetRequest 操作 是 原子 操作 一 一 要 么 所 有 的 值 都 提取 回来 ， 要 么 一 个 都 不 提取 。 
GetRequst 操作 不 成 功 的 原因 有 对 象 名 不 匹配 (noSuchName) 、 返 回 结果 太 长 (tooBig) 
以 及 其 他 原因 〈genErr) 。 
SNMP 只 允许 提取 MIB 树 中 的 叶子 对 象 的 值 。 因 此 不 能 只 提供 一 个 表 或 一 个 条 目的 名 字 
来 获取 整个 表 或 整 行 的 对 象 值 。 但 是 可 以 将 表 中 每 行 的 各 个 对 象 包含 在 变量 绑 定 中 ， 来 一 次 
获取 一 行 的 对 象 值 。 


14.3.7 GetNextRequest PDU 


GetNextRequest PDU 几乎 与 GetRequest PDU 相同 。 它 们 具有 相同 交换 模式 和 相同 的 格 
式 。 惟 一 的 不 同 是 : 在 GetRequest PDU 中 ， 变 量 绑 定 字段 中 列 出 的 是 要 取 值 的 对 象 实例 名 
本 身 ， 而 在 GetNextRequestPDU 中 ， 变 量 绑 定 字段 列 出 的 是 要 取 值 的 对 象 实例 的 “前 一 个 ” 
对 象 实例 名 。 与 GetRequest 相同 ，GetNextRequest 也 是 原子 操作 。 

虽然 与 GetRequest 的 外 在 差异 不 大 ， 但 是 GetNextRequest 却 有 GetRequest 无 法 替代 的 
用 途 。 它 能 够 使 网 络 管理 站 去 动态 地 发 现 一 个 MIB 视图 的 结构 。 它 也 为 查找 不 知 其 条 目的 表 
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提供 了 一 个 有 效 的 机 制 。 
1. 简单 对 象 值 的 提取 
假设 网 络 管理 站 希望 从 某 个 代理 者 处 提取 udp 组 中 的 所 有 简单 对 象 ， 则 它 可 以 发 出 一 个 
如 下 的 PDU: 
GetRequest(udpInDatagrams.0, udpNoPorts.0,udpInError.0,udpOutDatagrams.0) 
如 果 代 理 者 支持 所 有 这 些 对 象 ， 则 将 返回 一 个 包含 这 4 个 对 象 值 的 GetResponse PDU: 
GetResponse((udpInDatagrams.0 = 100), (udpNoPorts.0 = 1), (udpInErrors.0 = 2), 
(udpOutDatagrams.0 = 200)) 
kB, 100, 1, 2 和 200 分 别 是 这 4 个 对 象 的 值 。 然 而 ， 只 要 有 一 个 对 象 不 被 支持 ， 则 
代理 者 将 返回 一 个 含有 错误 码 NoSuchName 的 GetResponse PDU， 而 不 返回 任何 其 他 值 。 为 
了 确保 得 到 所 有 可 用 的 对 象 值 ， 管 理 站 必须 分 别 发 出 4 个 GetRequest PDU. 
现在 考虑 应 用 GetNextRequest PDU 的 情况 : 
GetNextRequest (udpInDatagrams, udpNoPorts, udpInErrors, udpOutDatagrams) 
其 中 ，udpInDatagrams = 1.3.6.1.2.1.7.1, udpNoPorts = 1.3.6.12.1.72, udpInErrors = 
1.3.6.1.2.1.7.3, udpOutDatagrams = 1.3.6.1.2.1.7.4。 
在 这 种 情况 下 ， 代 理 者 将 返回 清单 中 每 个 标识 符 的 “下 一 个 ”对 象 实例 的 值 。 假 设 4 个 
对 象 都 被 支持 ， 则 代理 者 返回 一 个 如 下 的 GetResponse PDU: 
GetResponse((udpInDatagrams.0 = 100), (udpNoPorts.0 = 1), (udpInErrors.0 = 2), 
(udpOutDatagrams.0 = 200)) 
这 与 前 面 的 情况 相同 。 假设 udpNoPorts 在 本 视图 中 是 不 存在 (不 可 见 ) 的 ， 则 代理 者 的 
应 答 为 : 
GetResponse((udpInDatagrams.0 = 100), (udpInErrors.0 = 2), (udpInErrors.0 = 2), 
(udpOutDatagrams.0 = 200)) 
由 于 udpNoPorts.0 = 1.3.6.1.2.1.7.2.0 在 本 MIB 视图 中 是 不 存在 的 标识 符 ， 因 此 
udpNoPorts 的 “下 一 个 ”对 象 实例 便 成 了 udpInError.O = 1.3.6.1.2.1.7.3.0。 
通过 对 比 可 知 ，GetNextRequest 在 提取 一 组 对 象 值 时 比 GetRequest 效率 更 高 ， 更 灵活 。 
2. 提取 未 知 对 象 
GetNextRequest 要 求 代理 者 提取 所 提供 的 对 象 标识 符 的 下 一 个 对 象 实例 的 值 ， 因 此 ， 发 
送 这 类 PDU 时 ， 并 不 要 求 提供 MIB 视图 中 实际 存在 的 对 象 或 对 象 实例 的 标识 符 。 利 用 这 一 
特点 ， 管 理 站 可 以 使 用 GetNextRequest PDU 去 探查 一 个 MIB 视图 ， 并 搞 清 它 的 结构 。 在 上 
面 的 例子 中 ， 如 果 管 理 站 发 出 一 个 GetNextRequest (udp) PDU， 则 将 获得 Response 
CudpInDatagrams.0 = 100) 的 应 答 。 管理 站 因此 便 知 道 了 在 这 个 MIB 视图 中 第 一 个 被 支持 的 
对 象 是 udpInDatagrams， 并 且 知 道 了 它 的 当前 值 。 


14.3.8 SetRequest PDU 


SNMP 实体 应 网 络 管理 站 应 用 程序 的 请 求 发 出 SetRequest PDU。 它 与 GetRequest PDU 
具有 相同 的 交换 模式 和 相同 的 格式 。 但 是 ，SetRequest 是 被 用 于 写 对 象 值 而 不 是 读 。 因 而 ， 
变量 绑 定 清单 中 既 包 含 对 象 实例 标识 符 ， 也 包含 每 个 对 象 实例 将 被 赋予 的 值 。 

SetRequest PDU $ SNMP 接收 实体 用 包含 相同 request-id 的 GetResponse PDU 进行 应 答 。 
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SetRequest 操作 是 原子 操作 一 一 要 么 变量 绑 定 中 的 所 有 变量 都 被 更 新 , 要 么 一 个 都 不 被 更 新 。 
如 果 应 答 实 体能 够 更 新 变量 绑 定 中 的 所 有 变量 ， 则 GetResponse PDU 中 包含 提供 给 各 个 变量 
的 值 的 变量 绑 定 字 段 。 只 要 有 一 个 变量 值 不 能 成 功 地 设置 ， 则 无 变量 值 返回 ， 也 无 变量 值 被 
更 新 .在 GetRequest 操 作 中 可 能 返回 的 错误 一 一 noSuchName、tooBig 和 genErr 也 是 SetRequest 
可 能 返回 的 错误 。 另 外 一 个 可 能 返回 的 错误 是 badValue， 只 要 SetRequest 中 有 一 个 变量 名 和 
变量 值 不 一 致 的 问题 ， 就 会 返回 这 个 错误 。 所 谓 不 一 致 可 能 是 类 型 的 问题 ， 也 可 能 是 长 度 的 
问题 ， 还 可 能 是 提供 的 实际 的 值 有 问题 。 

利用 SetRequest 不 仅 可 以 对 叶子 对 象 实例 进行 值 的 更 新 ， 也 可 以 利用 变量 绑 定 字 段 进 行 
表格 的 行 增加 和 行 删除 操作 。 

除 此 之 外 ，SetRequest 还 可 被 用 于 完成 某 种 动作 。SNMP 没有 提供 一 种 命令 代理 者 完成 
某 种 动作 的 机 制 , 它 的 全 部 能 力 就 是 在 一 个 MIB 视图 内 get 和 set 对 象 值 。 但 是 利用 set 的 功 
能 可 以 间接 地 发 布 完成 某 种 动作 的 命令 。 某 个 对 象 可 以 代表 某 个 命令 ， 当 它 被 设置 为 特定 值 
时 ， 就 执行 特定 的 动作 。 例 如 代理 者 可 以 设 一 个 初始 值 为 0 的 对 象 rrBoot， 如 果 管 理 站 将 这 
个 对 象 值 置 1， 则 代理 者 系统 被 重新 启动 ，reBoot 的 值 也 被 重新 置 0。 


14.3.9 Trap PDU 


SNMP 实体 应 网 络 管理 代理 者 应 用 程序 的 请 求 发 出 Trap PDU。 它 被 用 于 向 管理 站 异步 地 
通报 某 个 重要 事件 。 它 的 格式 与 其 他 的 SNMP PDU 完全 不 同 。 所 包含 的 字段 有 : 

O PDU 类 型 : 指出 Trap PDU 类 型 。 

O Enterprise: 标识 产生 本 Trap 的 网 络 管理 子 系统 (JH System 组 中 的 sysObjectId 值 )。 

O agentaddr: 产生 本 Trap HIX RHY IP 地 址 。 

C) generic-trap: 一 种 预定 义 的 trap. 

O specific-trap: 更 明确 地 指出 trap 特性 的 代码 。 

C) time-stamp: 发 出 trap 的 网 络 实体 从 上 次 重启 到 产生 本 trap 所 经 历 的 时 间 。 

C) variablebindings: 有 关 trap 的 附加 信息 〈 本 字段 的 意义 与 具体 实现 有 关 )。 


14.3.10 ”传输 层 的 支持 


SNMP 需要 利用 传输 层 的 服务 来 传递 SNMP 消息 , 但 是 它 并 未 假定 传输 层 的 服务 是 可 靠 
的 还 是 非 可 靠 的 ， 是 无 连接 的 还 是 面向 连接 的 。 

实际 上 , TE TCP/IP 体系 中 , SNMP 的 实现 几乎 都 是 使 用 无 连接 协议 用 户 数 据 报 CUDP) 。 
UDP 头 中 包含 源 和 目的 端口 字段 ， 人 允许 应 用 层 协 议 ， 如 SNMP 填写 地 址 。 它 还 包含 一 个 可 
选 的 覆盖 UDP 头 和 用 户 数据 的 校 验 和 (checksum) 。 如 果 校 验 和 有 问题 , UDP 片段 (segment) 
被 丢弃 。 两 个 端口 号 给 SNMP 应 用 ,用 于 代理 者 侦 听 GetRequest GetNextRequest 和 SetRequest 
命令 的 161 端口 和 用 于 管理 站 侦 听 Trap 命令 的 162 端口 。 

由 于 UDP 是 非 可 靠 的 ， 因 此 SNMP 的 消息 可 能 被 丢失 。SNMP 本 身 也 不 保证 消息 的 可 
靠 传递 ， 因 此 ， 处 理 消息 丢失 问题 的 负担 只 能 由 SNMP 的 用 户 自己 承担 。 

如 何 处 理 SNMP 消息 的 丢失 没有 标准 的 方法 ， 只 能 赁 通常 的 感觉 处 理 。 在 GetRequest 
和 GetNextRequest 的 场合 ， 如 果 在 规定 的 时 间 内 得 不 到 应 答 ， 管 理 站 可 以 认为 或 者 是 发 出 的 
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命令 消息 被 丢失 ,或 者 是 代理 者 返回 的 应 答 被 丢失 。 管 理 站 可 以 再 次 或 多 次 重 发 请 求 ， 直 至 
成 功 或 最 终 放弃 。 由 于 相同 的 请 求 具有 相同 的 request-id， 因 此 重 发 可 能 会 使 接收 者 收 到 多 个 
相同 的 消息 ， 但 这 并 不 会 引起 问题 ， 因 为 接收 者 可 以 简单 地 将 收 到 的 重复 的 消息 丢弃 。 

在 SetRequest 的 场合 ， 如 果 在 规定 的 时 间 内 得 不 到 应 答 ， 为 了 确认 操作 是 否 成 功 ， 可 以 
用 GetRequest 操作 进行 确认 。 如 果 确 认 set 操作 没 被 执行 ， 可 以 重 发 SetRequest。 

由 于 SNMP 的 Trap 没有 应 答 消 息 ， 因 此 没有 简单 的 方法 去 检验 Trap 的 传递 。 在 SNMP 
"B, Trap 一 般 用 于 提供 重要 事件 的 早期 告警 ， 作 为 后 备 方法 ， 管 理 站 还 要 定期 地 轮 询 代理 者 
获取 相关 的 状态 。 


14.4 SNMPv2 


14.4.1 SNMPv2 对 SNMPv1 的 改进 


1993 年 ，SNMP 的 改进 版 SNMPv2 开始 发 布 ， 从 此 ， 原 来 的 SNMP 便 被 称 为 SNMPv1。 
最 初 的 SNMPv2 最 大 的 特色 是 增加 了 安全 特性 ， 因 此 被 称 为 安全 版 SNMPv2。 但 不 幸 的 是 ， 
经 过 几 年 试用 ， 没 有 得 到 厂商 和 用 户 的 积极 响应 ， 并 且 也 发 现 自身 还 存在 一 些 严重 缺陷 。 因 
此 ， 在 1996 年 正式 发 布 的 SNMPv2 中 ， 安 全 特性 被 删除 。 这 样 ，SNMPv2 对 SNMPvI 的 改 
进程 度 便 受到 了 很 大 的 削弱 。 

总 的 来 说 ，SNMPv2 的 改进 主要 有 以 下 3 个 方面 : 

O “支持 分 布 式 管理 。 

O 改进 了 管理 信息 结构 。 

口 增强 了 管理 信息 通信 协议 的 能 力 。 

SNMPv1 采用 的 是 集中 式 网 络 管理 模式 。 网 络 管理 站 的 角色 由 一 个 主机 担当 。 其 他 设备 
(包括 代理 者 软件 和 MIB) 都 由 管理 站 监控 。 随 着 网 络 规模 和 业务 负荷 的 增加 ， 这 种 集中 式 
的 系统 已 经 不 再 适应 需要 。 管 理 站 的 负担 太 重 ， 并 且 来 自 各 个 代理 者 的 报告 在 网 上 产生 大 量 
的 业务 量 。 而 SNMPv2 不 仅 可 以 采用 集中 式 的 模式 ， 也 可 以 采用 分 布 式 模式 。 在 分 布 式 模式 
下 ， 可 以 有 多 个 顶层 管理 站 ， 被 称 为 管理 服务 器 。 每 个 管理 服务 器 可 以 直接 管理 代理 者 。 同 
时 , 管理 服务 器 也 可 以 委托 中 间 管 理 者 担当 管理 者 角色 监控 一 部 分 代理 者 。 对 于 管理 服务 器 ， 
中 间 管 理 器 又 以 代理 者 的 身份 提供 信息 和 接受 控制 。 这 种 体系 结构 分 散 了 处 理 负 担 ， 减 小 了 
网 络 的 业务 量 。 

SNMPv2 的 管理 信息 结构 (SMD 在 几 个 方面 对 SNMPv1 的 SMI 进行 了 扩充 。 定 义 对 象 
的 宏 中 包含 了 一 些 新 的 数据 类 型 。 最 引 人 注 目的 变化 是 提供 了 对 表 中 的 行进 行 删除 或 建立 操 
作 的 规范 。 新 定义 的 SNMPv2 MIB 包含 有 关 SNMPv2 协议 操作 的 基本 流量 信息 和 有 关 
SNMPv2 管理 者 和 代理 者 的 配置 信息 。 

在 通信 协议 操作 方面 ,最 引 人 注 目的 变化 是 增加 了 两 个 新 的 PDU 一 一 GetBulkRequest 和 
InformRequest。 前 者 使 管理 者 能 够 有 效 地 提取 大 块 的 数据 ， 后 者 使 管理 者 能 够 向 其 他 管理 者 
发 送 trap 信息 。 
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14.4.2 SNMPv2 网 络 管理 框架 


SNMPv2 提供 了 一 个 建立 网 络 管理 系统 的 框架 。 但 网 络 管理 应 用 ， 如 故障 管理 、 性 能 监 
测 、 计 费 等 不 包括 在 SNMPv2 的 范围 内 。 用 术语 来 说 , SNMPv2 提供 的 是 网 络 管理 基础 结构 。 
图 14.5 是 这 种 基础 结构 的 一 个 配置 实例 。 


管理 服务 器 


SNMPv2 管理 者 


中 间 管 理 者 co» 


NM d 


图 14.5 SNMPv2 的 配置 


SNMPv2 本 质 上 是 一 个 交换 管理 信息 的 协议 。 网 络 管理 系统 中 的 每 个 角色 都 维护 一 个 与 
网 络 管理 有 关 的 MIB。SNMPv2 的 SMI 对 这 些 MIB 的 信息 结构 和 数据 类 型 进行 定义 .SNMPv2 
提供 了 一 些 一 般 的 通用 的 MIB， 厂 商 或 用 户 也 可 以 定义 自己 私有 的 MIB。 

在 配置 中 至 少 有 一 个 系统 负责 整个 网 络 的 管理 。 这 个 系统 就 是 网 络 管理 应 用 驻 留 的 地 
方 。 管 理 站 可 以 设置 多 个 ， 以 便 提供 元 余 或 分 担 大 网 络 的 管理 责任 。 其 他 系统 担任 代理 者 角 
色 。 代 理 者 收集 本 地 信息 并 保存 ， 以 备 管理 者 提取 。 这 些 信息 包括 系统 自身 的 数据 ， 也 可 以 
包括 网 络 的 业务 量 信息 。 

SNMPv2 既 支 持 高 度 集中 化 的 网 络 管理 模式 ， 也 支持 分 布 式 的 网 络 管理 模式 。 在 分 布 式 
模式 下 ， 一 些 系统 担任 管理 者 和 代理 者 两 种 角色 ， 这 种 系统 被 称 为 中 间 管 理 者 。 中 间 管 理 者 
以 代理 者 身份 从 上 级 管理 系统 接受 管理 信息 操作 命令 ， 如 果 这 些 命令 所 涉及 的 管理 信息 在 本 
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地 MIB 中 , 则 中 间 管 理 者 便 以 代理 者 身份 进行 操作 并 进行 应 答 , 如 果 所 涉及 的 管理 信息 在 中 
间 管 理 者 的 下 属 代理 者 的 MIB 中 , 则 中 间 管 理 者 先 以 管理 者 身份 对 下 属 代理 者 进行 发 布 操作 
命令 ， 接 收 应 答 ， 然 后 再 以 代理 者 身份 向 上 级 管理 者 应 答 。 

所 有 这 些 信息 交换 都 利用 SNMPv2 通信 协议 实现 。 与 SNMPvI 相同 ，SNMPv2 协议 仍 
是 一 个 简单 的 请 求 〈request) /应 答 (response) 型 协议 ， 但 在 PDU 种 类 和 协议 功能 方面 对 
SNMPvI 进行 了 扩充 。 


14.4.3 ”协议 操作 


1. SNMPv2 消息 
与 SNMPv1 相同 ，SNMPv2 以 包含 协议 数据 单元 (PDU) 的 消息 的 形式 交换 信息 。 外 部 
的 消息 结构 中 包含 一 个 用 于 认证 的 共同 体 名 。 


SNMPv2 确定 的 消息 结构 如 下 : 

Message :: = SEQUENCE { 
version INTEGER { version (1) }, -- SNMPv2 的 版 本 号 为 1 
community OCTET STRING, -- 共同 体 名 
data ANY -- SNMPv2 PDU 


) 


14.32 节 中 对 于 共同 体 名 、 共 同体 轮廓 和 访问 策略 的 讨论 同样 适用 于 SNMPv2。 

SNMPv2 消息 的 发 送 和 接收 过 程 与 14.3.5 节 中 描述 的 SNMPv1 消息 的 发 送 和 接收 过 程 相同 。 

2. PDU 格式 

在 SNMPv2 消息 中 可 以 传送 7 类 PDU。 表 14.11 列 出 了 这 些 PDU, 同时 指出 了 对 SNMPv1 
也 有 效 的 PDU。 图 14.6 描述 了 SNMPv2 PDU 的 一 般 格式 。 


表 14.11 SNMP 协 议 数据 单元 (PDUs) 


PDU SNMPv2 
Get 管理 者 通过 代理 者 获得 每 个 对 象 的 值 e. 
GetNext 管理 者 通过 代理 者 获得 每 个 对 象 的 下 一 个 什 e 
GetBulk 管理 者 通过 代理 者 获得 每 个 对 象 的 N 个 值 e 
Set 管理 者 通过 代理 者 为 每 个 对 象 设置 值 e. 
Trap 代理 者 向 管理 者 传送 随机 信息 e 
Inform 管理 者 向 代理 者 传送 随机 信息 e 
Response 代理 者 对 管理 者 的 请 求 进行 应 答 ° 


值得 注意 的 是 ，GetRequest、GetNextRequest、SetRequest、SNMPv2-Trap、InformReques 
五 种 PDU 具有 完全 相同 的 格式 ， 并 且 也 可 以 看 作 是 error-status 和 error-index 两 个 字段 被 置 
Eff] Response PDU 的 格式 。 这样 设计 的 目的 是 为 了 减少 SNMPv2 实体 需要 处 理 的 PDU 格式 
种 类 。 
(1) GetRequest PDU 
SNMPv2 的 GetRequest PDU 的 语法 和 语义 都 与 SNMPvI 的 GetRequest PDU 相同 ， 差 别 
是 对 应 答 的 处 理 。SNMPv1l 的 GetRequest 是 原子 操作 : 要 么 所 有 的 值 都 返回 ， 要么 一 个 也 不 
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返回 , 而 SNMPv2 能 够 部 分 地 对 GetRequest 操作 进行 应 答 。 即 使 有 些 变量 值 提供 不 出 来 , 变 
量 绑 定 字段 也 要 包含 在 应 答 的 GetResponse PDU 之 中 。 如 果 某 个 变量 有 意外 情况 

(noSuchObject, noSuchInstance,endOfMibView) ， 则 在 变量 绑 定 字段 中 ， 这 个 变量 名 与 一 个 
代表 意外 情况 的 错误 代码 而 不 是 变量 值 配对 。 


PDUtype | request-id 0 0 variable-bindings 


(a) GetRequest-PDU, GetNextRequest-PDU, SetRequest-PDU. SNMPv2-Trap-PDU.InformRequest-PDU 


PDU type request-id error-status error-index variable-bindings 


(b) Response-PDU 


PDU type request-id non-repeaters | max-repetitions | variable-bindings 


Cc) GetBulkRequest-PDU 


namel | valuel | name2 | value2 63 namen | valuen 


(d) Variable-bindings 
14.6 SNMPv2 PDU 格式 


在 SNMPv2 中 ， 按 照 以 下 规则 处 理 GetRequest 变量 绑 定 字段 中 的 每 个 变量 来 构造 应 答 
PDU: 
MR OBJECT IDENTIFIER iiA 5 iE (38:25 Ab Pr BE s ad HRE RO TAB AB UG 
配 ， 则 它 的 值 字段 被 设置 为 noSuchObject。 
口 ” 和 否则 ， 如 果 变 量 名 与 该 请 求 在 代理 者 处 所 能 访问 的 变量 的 名 称 都 不 匹配 ， 则 它 的 值 
字段 被 设置 为 noSuchInstance。 
O ”否则 ， 值 字段 被 设置 为 变量 值 。 
如 果 由 于 其 他 原因 导致 变量 名 处 理 过 程 的 失败 ， 则 无 法 返回 变量 值 。 这 时 ， 应 答 实 体 将 
返回 一 个 error-status 字段 值 为 genErr， 并 在 error-index 字段 中 指出 问题 的 变量 的 应 答 PDU。 
如 果 生 成 的 应 答 PDU 中 的 消息 尺寸 过 大 ， 超 过 了 指定 的 最 大 限度 ， 则 生成 的 PDU RE 
弃 ， 并 用 一 个 error-status 字段 值 为 tooBig，error-index 字段 值 为 0， 变 量 绑 定 字段 为 空 的 新 
的 PDU 应 答 。 
允许 部 分 应 答 是 对 GetRequest 的 重要 改进 。 在 SNMPv1 中 ， 只 要 有 一 个 变量 值 取 不 回 
来 ， 所 有 的 变量 值 就 都 不 能 返回 。 在 这 种 情况 下 ， 发 出 操作 请 求 的 管理 者 往往 只 能 将 命令 拆 
分 为 多 条 只 取 单 个 变量 值 的 命令 。 相 比 之 下 ，SNMPv2 的 操作 效率 得 到 了 很 大 提高 。 
(2) GetNextRequest PDU 
SNMPv2 的 GetNextRequest PDU 的 语法 和 语义 都 与 SNMPv1 的 GetNextRequest PDU 相 
同 。 与 GetRequestPDU 相同 ， 两 个 版 本 的 差别 是 对 应 答 的 处 理 。SNMPv1 的 GetNextRequest 
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是 原子 操作 : 要 么 所 有 的 值 都 返回 ， 要 么 一 个 也 不 返回 ， 而 SNMPv2 能 够 部 分 地 对 
GetNextRequest 操作 进行 应 答 。 

在 SNMPv2 中 ,按照 以 下 规则 处 理 GetNextRequest 变量 绑 定 字段 中 的 每 个 变量 来 构造 应 
答 PDU: 

口 ”确定 被 指名 的 变量 下 一 个 变量 , 将 该 变量 名 和 人 它 的 值 成 对 地 放 入 结果 变量 绑 定 字段 中 。 

口 ” 如 果 被 指定 的 变量 之 后 不 存在 变量 , 则 将 被 指定 的 变量 名 和 错误 代码 endOfMibView 

成 对 地 放 入 结果 变量 绑 定 字 段 中 。 

如 果 由 于 其 他 原因 导致 变量 名 处 理 过 程 的 失败 ， 或 者 是 产生 的 结果 太 大 ， 处 理 过 程 与 

GetRequest 相同 。 
(3) GetBulkRequest 

SNMPv2 的 一 个 主要 改进 是 GetBulkRequest PDU。 这 个 PDU 的 目的 是 尽量 减少 查询 大 
量 管理 信息 时 所 进行 的 协议 交换 次 数 。GetBulkRequest PDU 允许 SNMPv2 管理 者 请 求 得 到 在 
给 定 的 条 件 下 尽 可 能 大 的 应 答 。 

GetBulkRequest 操作 利用 与 GetNextRequest 相同 的 选择 原则 ， 即 总 是 顺序 选择 下 一 个 对 
象 。 不 同 的 是 ， 利 用 GetBulkRequest， 可 以 选择 多 个 后 继 对 象 。 

GetBulkRequest 操作 的 基本 工作 过 程 如 下 : GetBulkRequest 在 变量 绑 定 字段 中 放 入 一 个 

(N+R) 个 变量 名 的 清单 。 对 于 前 N 个 变量 名 ， 查 询 方式 与 GetNextRequest 相同 。 即 对 清单 

中 的 每 个 变量 名 ， 返 回 它 的 下 一 个 变量 名 和 它 的 值 ， 如 果 没 有 后 继 变量 ， 则 返回 原 变量 名 和 
一 个 endOfMibView 的 值 。 

GetBulkRequest PDU 有 两 个 其 他 PDU 所 没有 的 字段 ，non-repeaters 和 max-repetitions.. 

non-repeaters 字段 指出 只 返回 一 个 后 继 变 量 的 变量 数 。 max-repetitions 字段 指出 其 他 的 变 
量 应 返回 的 最 大 的 后 继 变量 数 。 为 了 说 明 算法 ， 我 们 定义 : 

工 = 变量 绑 定 字 段 中 的 变量 名 数量 

N= 只 返回 一 个 后 继 变 量 的 变量 名 数 

R= 返回 多 个 后 继 变量 的 变量 名 数 

M= 最 大 返回 的 后 继 变 量 数 

在 上 述 变 量 之 间 存 在 以 下 关系 : 

N = MAX [MIN (non-reperters, L), 0] 

M = MAX [max-repetitions, 0] 

R=L-N 

如 果 N 大 于 0， 则 前 NAER GetNextRequest 一 样 被 应 答 。 如 果 尺 大 于 0 并 且 M 大 
于 0， 则 对 应 后 面 的 R 个 变量 ， 返 回 M 个 后 继 变 量 。 即 ， 对 于 每 个 变量 : 

口 ” 获 得 给 定 变量 的 后 继 变量 的 值 。 

口 ” 获 得 下 一 个 后 继 变 量 的 值 。 

O 反复 执行 上 一 步 ， 直 至 获得 M 个 对 象 实例 。 

如 果 在 上 面 的 过 程 中 的 某 一 点 ， 已 经 没有 后 继 变 量 ， 则 返回 endOfMibView 值 ， 在 变量 
名 处 ， 返 回 最 后 一 个 后 继 变量 ， 如 果 没 有 后 继 变量 ， 则 返回 请 求 中 的 变量 名 。 

利用 这 个 规则 ， 能 够 产生 的 name-value 对 的 数量 是 N+(MxR)。 后 面 的 (MxR) 对 在 应 答 
PDU 中 的 顺序 可 描述 为 : 

fori:=1to M do 
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forr:=1toRdo 
retrieve i-th successor of (N+1)-th variable 

即 ， 返 回 的 后 继 变 量 是 一 行 一 行 的 ， 而 不 是 先 返回 第 一 个 变量 的 所 有 后 继 变量 ， 再 返回 
第 二 个 变量 的 所 有 后 继 变 量 等 。 

GetBulkRequest 操作 解除 了 SNMP 的 一 个 主要 限制 , 即 不 能 有 效 地 检索 大 块 数据 。 此 外 ， 
利用 这 个 功能 可 以 减 小 管理 应 用 程序 的 规模 。 管 理应 用 程序 自身 不 需要 关心 组 装 在 一 起 的 请 
求 的 细节 。 不 需要 执行 一 个 试验 过 程 来 确认 请 求 PDU 中 的 name-value 对 的 最 佳 数量 。 并 且 ， 
即使 GetBulkRequest 发 出 的 请 求 过 大 ， 代 理 者 也 会 尽量 多 地 返回 数据 不 是 简单 地 返回 一 个 
tooBig 的 错误 消息 。 为 了 获得 缺少 的 数据 ， 管 理 者 只 需 简单 地 重 发 请 求 ， 而 不 必 将 原来 的 请 
求 改 装 为 小 的 请 求 序列 。 

(4) SetRequest 

SetRequest PDU 由 管理 者 发 出 ， 用 来 请 求 改变 一 个 或 多 个 对 象 的 值 。 接 收 实体 用 一 个 包 
含 相同 request-id 的 Response PDU 应 答 。 与 SNMPv1 相同 ，SetRequest 操作 是 原子 操作 ， 即 
或 者 更 新 所 有 被 指名 的 变量 ， 或 者 所 有 的 都 不 更 新 。 如 果 接 收 实体 能 够 为 被 指名 的 所 有 变量 
设置 新 值 ， 则 Response PDU 返回 与 SetRequest 相同 的 变量 绑 定 字段 。 只 要 有 一 个 变量 值 没 
设置 成 功 ， 就 不 更 新 任何 值 。 

SetRequest 的 变量 绑 定 分 两 个 阶段 处 理 。 在 第 一 阶段 ， 确 认 每 个 绑 定 对 。 如 果 所 有 的 绑 定 
对 都 被 确认 ， 则 进入 第 二 阶段 一 一 改变 每 个 变量 。 即 每 个 变量 的 set 操作 都 在 第 二 阶段 进行 。 

在 第 一 阶段 中 ， 对 每 个 绑 定 对 进行 以 下 确认 ， 直 至 所 有 的 都 成 功 或 遇 到 一 个 失败 。 失 败 
的 原因 有 : 不 可 访问 CnoAccess) 、 无 法 建立 或 修改 〈notWritable) 、 数 据 类 型 不 一 臻 

CwrongType) , &BEAS— S CwrongLength) , ASN.1 编码 不 一 致 . 变量 值 有 问题 (wrongValue)、 
变量 不 存在 且 无 法 建立 (noCreation) 等 。 如 果 任 意 一 个 变量 遇 到 以 上 情况 ， 则 返回 一 个 在 
error-status 字段 给 出 上 述 错误 代码 , 在 error-index 字段 给 出 有 问题 的 变量 的 序号 的 应 答 PDU。 
与 SNMPv1 相 比 ， 提 供 了 更 多 的 错误 代码 。 为 管理 站 更 容易 地 确定 失败 的 原因 提供 了 方便 。 

如 果 在 确认 阶段 没有 遇 到 问题 ， 则 进入 第 二 阶段 一 一 更 新 在 变量 绑 定 字 段 中 被 指名 的 所 
有 的 变量 。 不 存在 的 变量 需要 建立 ， 存 在 的 变量 被 赋予 新 值 。 只 要 遇 到 任何 失败 ， 则 所 有 的 
更 新 都 被 撤销 ， 并 且 返 回 一 个 error-status 字段 值 为 commitFailed 的 应 答 PDU。 

(5) SNMPv2 Trap 

SNMPv2 Trap PDU 由 一 个 代理 者 实体 在 发 现 异常 事件 时 产生 并 发 给 管理 站 。 与 SNMPv1 
相同 , 它 用 于 向 管理 站 提供 一 个 异步 的 通报 以 便 报告 重要 事件 。 但 它 的 格式 与 SNMPv1 不 同 ， 
与 GetRequest、GetNextRequest、GetBulkRequest、SetRequest 和 InformRequest PDU 拥有 相 
同 的 格式 。 变 量 绑 定 字段 用 于 容纳 与 陷阱 消息 有 关 的 信息 。Trap PDU 是 一 个 非 认证 消息 , 不 
要 求 接收 实体 应 答 。 

(6) InformRequest 

InformRequest PDU 由 一 个 管理 者 角色 的 SNMPv2 实体 应 它 的 应 用 的 要 求 发 给 另 一 个 管 
理 者 角色 的 SNMPv2 实体 , 请 求 后 者 向 某 个 应 用 提供 管理 信息 。 与 SNMPv2 Trap PDU 类 似 ， 
变量 绑 定 字段 被 用 于 传送 相关 的 信息 。 

收 到 InformRequest 的 实体 首先 检查 承载 应 答 PDU 的 消息 尺寸 ,如 果 消 息 尺 寸 超过 限度 ， 
用 一 个 含有 tooBig 错误 代码 的 Response PDU 应 答 。 否则 , 接收 实体 将 PDU 中 的 内 容 转 到 信 
息 的 目的 地 ( 某 个 应 用 ), 同时 对 发 出 mformRequest 的 管理 者 用 error-status 字段 值 为 noError 
的 Response PDU 进行 应 答 。 
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我 们 在 第 3 章 讲述 的 TP 协议 的 版 本 是 第 4 版 .下 第 4 版 作为 网 络 的 基础 设施 而 广泛 地 
应 用 在 Internet 和 难以 计数 的 小 型 专用 网 络 上 。 尽 管 IPv4 是 一 个 非常 成 功 的 协议 ， 它 可 以 
把 数 十 个 或 数 百 个 网 络 上 的 数 以 百 计 或 数 以 千 计 的 主机 连接 在 一 起 ， 但 它 现在 越 来 越 显 得 
不 适应 Internet 的 发 展 了 。 本 章 将 讲述 IPv4 存在 哪些 问题 并 介绍 IP 协议 的 新 版 本 ， 版 本 
6。 


15.1 IPv4 的 不 足 与 缺点 


IPv4 的 确 是 一 个 非常 健壮 的 协议 , 并 已 经 证 明了 它 能 够 连接 小 至 几 个 节点 , 大 至 Internet 
上 难以 计数 的 主机 。 目 前 ， 几 乎 所 有 的 网 络 都 在 使 用 IP 协议 进行 通信 ， 而 正 是 因为 人 P 协议 
应 用 的 如 此 广泛 , 它 的 改变 将 对 所 有 使 用 他 的 人 产生 重大 影响 。 早 在 20 世纪 80 年 代 初 期 人 
们 就 意识 到 了 升级 的 需求 ， 因 为 当时 已 经 发 现 TP 地 址 空间 随 着 Internet 的 发 展 只 能 支持 很 短 
的 时 间 。 本 节 将 介绍 必须 升级 IP 的 原因 以 及 可 以 同时 改进 之 处 ， 其 中 包括 : 
CD 地 址 空间 的 局 限 性 :IP 地 址 空间 的 危机 由 来 已 入 ， 并 正 是 升级 的 主要 动力 。 
(2) 性 能 :尽管 他 表现 得 不 错 , 一 些 源 自 20 年 甚至 更 早 以 前 的 设计 还 能 够 进一步 改 
进 。 
G) RE: 安全 性 一 直 被 认为 是 由 网 络 层 以 上 的 层 负责 ， 但 它 现在 已 经 成 为 耳 的 下 
一 个 版 本 可 以 发 挥 作 用 的 地 方 。 
(4) 配置 : 对 于 IPv4 节点 的 配置 一 直 比 较 复杂 。 现 在 笔记 本 等 IP 主机 移动 性 的 增强 要 
求 当主 机 在 不 同 网 络 间 移 动 和 使 用 不 同 的 网 络 接 入 点 时 能 提供 更 好 的 配置 支持 。 
下 面具 体 说 明 IPv4 的 这 些 问 题 。 


15.1.1 IP 地 址 空间 危机 


Internet 经 历 了 飞速 的 发 展 ， 在 过 去 的 十 多 年 间 ， 连 接 到 Internet 的 网 络 数量 每 隔 不 到 一 
年 的 时 间 就 会 增加 一 倍 。 但 即便 是 这 样 的 发 展 速度 ， 也 并 不 足以 导致 20 世纪 90 年 代 后 期 也 
地 址 的 匮乏 。 耳 地 址 为 32 位 长 ， 地 址 空间 可 能 具有 多 于 40 亿 的 地 址 。 导 致 瑟 地 址 耗 尽 的 
主要 原因 不 在 于 IP 地 址 的 长 度 ， 而 在 于 IP 地 址 的 结构 。 卫 地 址 采用 分 级 地 址 结构 ， 一 个 他 
地 址 由 网 络 地 址 部 分 和 主机 地 址 部 分 构成 。 通 过 使 用 分 级 地 址 格式 ， 即 每 台 主机 首先 依据 它 
所 连接 的 网 络 进行 标识 。 卫 可 支持 简单 的 路 由 协议 ， 主 机 只 需要 了 解 彼此 的 IP 地 址 ， 就 可 
以 将 数据 从 一 台 主 机 上 传输 到 另 一 台 主 机 。 这 种 分 级 地 址 把 地 址 分 配 的 工作 交 给 了 网 络 管理 
员 。 到 网 络 外 的 数据 依据 网 络 地 址 进行 路 由 ， 在 数据 到 达 目 的 主机 所 连接 的 路 由 器 之 前 无 需 
了 解 主机 地 址 。 
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如 果 不 使 用 这 种 分 级 地 址 结构 ， 而 通过 一 个 中 央 授 权 机 构 顺 序 化 地 为 每 台 主机 指派 地 址 
可 能 会 使 地 址 指派 更 加 高 效 ， 但 是 这 几乎 使 所 有 其 他 的 网 络 功能 不 可 行 。 例 如 ， 路 由 将 实质 
上 不 可 行 。 

IP 地 址 被 分 为 A、B、C、D、E 五 类 ， 只 有 前 三 类 用 于 IP 网 络 。 近 年 来 ， 随 着 Internet 
的 膨胀 ， 地 址 资源 已 显得 越 来 越 紧张 。 尽 管 人 们 已 采用 子 网 掩 码 和 无 域 间 路 由 等 技术 减少 了 
B 类 地 址 的 消耗 ， 减 轻 了 IP 地 址 的 浪费 ， 但 并 没有 从 根本 上 解决 问题 。 


15.1.2 IP 性 能 问题 


王刚 开始 时 ， 其 主要 目的 在 于 为 在 异种 网 络 间 进 行 数据 的 可 靠 、 健 壮 和 高 效 传输 提供 最 
佳 机 制 ， 从 而 实现 不 同 计算 机 的 互 操作 。 在 很 大 程度 上 IP. 实现 了 此 目标 ， 但 这 并 不 意味 着 
IP 不 能 加 以 改进 。 近 几 年 ， 随 着 Intemet 及 其 应 用 的 发 展 ， 对 改进 IP 的 要 求 越 来 越 紧 迫 。 在 
升级 中 主要 考虑 最 大 传输 单元 、 最 大 包 长 度 、IP 头 的 设计 、 校 验 和 的 使 用 、 卫 选项 的 应 用 等 
议题 。 针 对 这 些 议题 已 经 提出 了 专门 建议 并 已 引入 IPv6 中 ， 这 将 有 利于 提高 IPv6 的 性 能 并 
改进 IPv6 作为 继续 高 速 发 展 的 网 络 基础 的 能 力 。 


151.3 IP 安全 性 问题 


刚 开始 时 连 入 Internet 的 都 是 侧重 于 研究 与 开发 的 机 构 ， 当 时 安全 性 不 是 一 个 主要 问题 。 
更 重要 的 是 ， 很 久 以 来 人 们 认为 安全 性 问题 在 网 络 协 议 栈 的 低层 并 不 重要 ， 应 用 安全 性 的 责 
任 仍 交 给 应 用 层 。 在 这 种 情况 下 ，IPv4 几乎 没有 采取 任何 的 安全 保护 措施 ， 只 具备 最 少 的 安 
全 性 选项 。 这 对 于 目前 开放 的 Intemet 显然 是 不 适应 的 。 


15.1.4 配置 问题 


在 他 协议 的 早期 , 大 部 分 使 用 他 协议 接 入 Internet 的 计算 机 都 是 大 型 的 计算 机 , 它们 与 
Internet 的 连接 基本 上 是 静态 的 。 且 使 用 这 些 计算 机 的 人 员 都 是 熟悉 IP 协议 的 计算 机 专业 研 
究 人 员 。 但 现在 则 完全 不 同 ， 人 们 可 以 选择 任意 的 I SP， 他 们 可 能 携带 笔记 本 电脑 从 一 个 网 
络 转移 到 另 一 个 网 络 ， 而 且 现 在 的 无 线 网 络 技术 可 能 使 得 这 种 网 络 间 的 移动 是 不 易 察觉 的 。 
而 且 现在 使 用 计算 机 和 网 络 的 人 员 可 能 根本 不 懂 计算 机 和 网 络 。 尽 管 动态 主机 配置 协议 
(DHCP) 可 以 允许 系统 在 启动 时 通过 服务 器 获取 其 正确 和 完整 的 IP 网 络 配置 ， 但 主机 CX 
论 是 移动 的 还 是 固定 的 ) 仍然 依赖 于 到 网 络 的 单 点 连接 。 


15.1.5 IP 协议 的 升级 策略 


IPv4 的 问题 还 不 止 上 面 列 举 的 几 个 ， 例 如 还 有 : 网 络 越 多 意味 着 路 由 表 越 大 ， 同 时 导致 
路 由 器 的 性 能 下 降 ; 难以 实现 的 IPv4 选项 意味 着 这 些 选项 中 实现 的 功能 对 用 户 不 可 用 。 如 果 
只 是 简单 地 倍增 IP 地 址 的 长 度 而 不 修改 协议 的 其 他 部 分 ， 那 么 所 有 的 TCP/IP 协议 栈 将 需要 
同时 更 新 。 尽 管 这 种 改变 已 经 相对 简单 ， 但 是 由 于 错误 配置 而 导致 的 系统 瘫痪 仍 将 产生 巨大 
影响 。 对 于 拥有 许多 用 户 和 主机 的 大 型 机 构 ， 这 绝 不 是 一 件 简单 的 事情 。 更 复杂 的 是 ， 有 些 
系统 中 有 许多 是 比较 老 的 或 过 时 的 甚至 是 已 经 废弃 的 系统 ， 在 这 些 系统 上 运行 的 网 络 软件 可 
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能 已 经 过 期 并 且 没 有 人 再 提供 支持 。 任 何 对 于 现 有 系统 进行 升级 的 请 求 都 可 能 导致 混乱 。 对 
于 IPv4 的 修补 , 无 论 是 临时 加 入 一 个 补丁 还 是 用 另 一 个 重新 设计 的 协议 来 替换 , 都 将 导致 混 
8L. 与 其 他 方法 相 比 ， 升 级 不 会 带 来 更 多 的 痛苦 。 因 此 IPv6 协议 规范 在 1995 年 底 提交 IETF 
并 获得 批准 。 各 软件 厂商 也 逐渐 开始 提供 对 IPv6 的 支持 ,各 种 IPv6 的 试验 骨干 网 也 已 建立 。 


15.2 ”改进 IPv4 的 各 种 努力 


自从 意识 到 IPv4 的 不 足 ， 各 种 改进 IPv4 的 努力 就 在 不 断 进行 。 本 节 将 列 出 改进 IPv4 应 
该 考虑 的 问题 以 及 现 有 的 各 种 努力 。 


15.2.1 Internet 发 展 的 问题 


对 IPv4 的 改进 应 当 集 中 在 如 下 几 个 方面 : 路 由 与 寻 址 、 多 协议 体系 结构 、 安 全 性 体系 结 
构 、 流 量 控制 等 。 下 面 就 每 个 问题 展开 讨论 。 
15.2.1.1 寻 址 与 路 由 


地 址 空间 毫 无 疑问 已 经 是 一 个 问题 ,而 路 由 表 的 膨胀 也 值得 密切 注意 。 不 仅 IPv4 的 地 址 
空间 将 耗 尽 ， 而 且 在 此 之 前 可 能 IPv4 的 路 由 算法 已 经 无 法 适应 如 此 大 数量 的 网 络 。 

对 于 寻 址 方案 可 能 的 修改 包括 使 用 现 有 的 32 位 地 址 作为 一 个 非 全 球 惟一 的 标识 。 即 ， 
在 网 络 中 不 互通 的 部 分 间 地 址 可 以 重用 。 例 如 ， 把 全 球 分 为 几 个 不 同 的 域 ， 这 使 得 一 个 主机 
地 址 在 每 个 域 中 都 可 以 使 用 一 次 ， 而 域 间 的 互 操作 将 通过 协议 网 关 在 数据 进行 域 间 切 换 时 重 
写 其 地 址 而 进行 。 另 一 种 寻 址 方案 是 只 增加 主机 地 址 字段 的 长 度 ， 并 集成 一 个 管理 域 作为 网 
络 地 址 的 一 部 分 。 第 三 种 方案 是 使 用 让 路 由 器 将 主机 地 址 与 管理 域 映 射 的 连接 策略 扩展 主机 
地 址 字段 ， 并 将 整个 字段 作为 一 个 非 层次 地 址 空间 。 


15.2.1.2 多 协议 体系 结构 


对 互 操作 的 OSI 传 输 与 TCP/IP 业务 流 的 支持 是 需要 进一步 开发 的 一 个 重要 方面 .Internet 
的 连接 意味 着 一 个 主机 必须 具备 一 个 他 地 址 。 如 果 没 有 一 个 P 地 址 并 且 没 有 运行 IP， 那 么 
将 不 能 上 网 。 但 TCP/IP 应 该 而 且 可 以 包含 或 借鉴 其 他 协议 。 而 互 操 作 性 ， 尤 其 是 应 用 之 间 
而 不 是 低层 之 间 的 互 操 作 性 是 有 益 的 。 


15.2.1.3 ”安全 性 


美国 国防 部 对 于 重点 研究 和 开发 工作 的 投资 导致 了 IP 的 产生 。 但 是 ， 商 用 Internet 在 安 
全 性 需求 上 与 军队 的 网 络 是 不 同 的 ， 并 且 向 一 个 协议 集中 添加 安全 性 要 比 从 头 建设 一 个 安全 
性 协议 难得 多 。 安 全 服务 的 一 个 建议 是 根据 不 同 的 用 户 名 进行 身份 验证 并 加 以 访问 控制 。 同 
时 还 提出 了 关于 一 致 性 的 强制 措施 ， 其 中 包含 了 一 些 方法 来 防止 传输 过 程 中 数据 被 修改 以 及 
对 于 传输 源 的 欺骗 和 抵御 重播 攻击 。 其 他 的 服务 包括 机 密 性 、 不 可 再 现 性 使 用 数字 签名 来 
防止 发 送 方 拒绝 承认 发 送 了 某 段 数据 ) 和 通过 拒绝 对 于 某 些 服务 的 攻击 以 实现 保护 。 
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15214 流量 控制 


IPv4 是 一 个 无 连接 协议 ， 但 一 些 进程 〈 例 如 语音 和 图 像 ) 需要 一 定 程度 的 流量 控制 以 正 
常 工作 。 在 IPv4 中 定义 了 服务 类 型 TOS 字段 ， 但 该 字段 不 仅 没有 得 到 广泛 应 用 而 且 现在 连 
如 何 实现 都 不 清楚 。 


1522 各 种 努力 


IPv6 并 不 是 IPv4 的 惟一 的 改进 升级 方案 。 

IETF 在 1994 年 考虑 了 三 个 主要 提案 。 RFC1347, 含有 更 多 地 址 的 TCP 和 UDP (TUBA) 
是 其 中 之 一 。TUBA 是 一 个 简单 的 Internet 寻 址 和 路 由 协议 ， 可 以 认为 是 简单 地 用 OSI 网 络 
互联 协议 和 无 连接 网 络 协议 (CLNP) 替换 了 IP. CLNP 中 使 用 了 网 络 服务 访问 点 (NSAP) 
地 址 ， 该 地 址 可 以 是 任意 长 度 ， 从 而 提供 了 足够 的 地 址 空间 。 另 一 个 提案 在 1992 年 以 IPv7 
出 现 ， 并 在 1993 年 的 RFC1475 中 详细 描述 ， 其 标题 为 “TP/IX: 下 一 代 的 Internet”。TP/IX 
使 用 64 位 地 址 ， 并 在 分 级 结构 中 加 入 了 位 于 各 单位 之 上 的 寻 址 层 以 用 于 管理 。IPv7 的 8 字 
节 地 址 中 有 3 个 字 节 用 于 管理 域 ，3 个 字 节 用 于 各 单位 的 网 络 ， 另 2 个 字 节 用 于 标识 主机 。 
IPv7 包头 在 对 IPv4 的 包头 进行 简化 的 同时 ， 也 加 入 了 转发 路 由 标识 符 ， 使 得 中 介 路 由 器 可 
以 根据 它 来 决定 如 何 处 理 数据 包 。 第 三 种 提案 有 时 称 为 卫 中 的 也 ,或 他 封装 。 在 这 个 提案 
H, PESKE: 一 层 用 于 全 球 骨 干 网 络 ， 而 另 一 层 用 于 比较 有 限 的 范围 。 在 有 限 范围 内 仍 
然 使 用 IPv4, 但 骨干 网 络 中 使 用 不 同 地 址 的 新 的 一 层 。 后 来 这 种 提案 不 断 演 变 并 与 其 他 协议 
相 融 合 从 而 产生 了 简单 增强 IP (SIPP) o SIPP 经 过 一 些 修改 之 后 ， 被 IESG 接受 作为 IPng 
的 基础 。 

1995 年 发 布 的 RFC1752 指出 了 Png 将 来 的 样子 。 该 协议 提案 中 包括 一 个 拥有 分 级 地 址 结 
构 的 简化 的 头 结构 、 包 一 级 的 身份 验证 和 加 密 功 能 以 及 即 插 即 用 的 自动 配置 功能 。IPng 基于 
SIPP 的 128 位 地 址 。 该 RFC 中 的 其 他 部 分 为 ntemet 研究 小 组 解决 IPv4 中 的 问题 提供 了 非常 
好 的 历史 资料 ， 同 时 也 提供 了 对 于 三 个 竞争 者 : TUBA、CATNIP 和 SIPP 的 详细 的 分 析 。 

5 IPv6 协议 相关 的 REC 是 在 1996 年 和 1998 年 发 表 的 ， 在 后 面 的 各 节 将 详细 介绍 IPv6 
的 机 制 。 


153 IPv6 对 IPv4 的 改进 


IPv6 的 变化 体现 在 以 下 五 个 重要 方面 : 扩展 地 址 、 简 化 头 格式 、 增 强 对 于 扩展 和 选项 的 
支持 、 流 标记 和 身份 验证 和 保密 。IPv6 的 这 些 改 进 都 解决 了 上 节 中 提 到 的 改进 IPv4 应 该 考 
虑 和 解决 的 各 种 问题 。IPv6 的 扩展 地 址 使 得 Internet 可 以 继续 增长 而 无 需 考虑 地 址 资源 的 消 
耗 ， 该 地 址 结构 对 于 提高 路 由 效率 有 所 帮助 ; 包头 的 简化 减少 了 路 由 器 上 所 需 的 处 理 过 程 ， 
从 而 提高 了 路 由 的 效率 ; 同时 ， 改 进 对 头 扩展 和 选项 的 支持 意味 着 可 以 在 几乎 不 影响 普通 数 
据 包 和 特殊 包 路 由 的 前 提 下 适应 更 多 的 特殊 需求 ; 流标 记 办 法 为 更 加 高 效 地 处 理 包 流 提供 了 
一 种 机 制 , 这 种 办 法 对 于 实时 应 用 尤其 有 用 ; 身份 验证 和 保密 的 改进 使 得 IPv6 更 加 适用 于 那 
些 要 求 对 敏感 信息 和 资源 特别 对 待 的 应 用 。 下 面 来 看 Pv6 在 各 方面 采用 的 机 制 。 
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15.3.1. 扩展 地 址 


IPv6 的 地 址 结构 中 除了 把 32 位 地 址 空间 扩展 到 了 128 位 外 ,还 对 IP 主机 可 能 获得 的 不 
同类 型 地 址 作 了 一 些 调整 。 IPv6 中 取消 了 广播 地 址 而 代 之 以 任意 点 播 地 址 。IPv4 中 用 于 指定 
一 个 网 络 接口 的 单 播 地 址 和 用 于 指定 由 一 个 或 多 个 主机 侦 听 的 多 播 地 址 基本 不 变 。 


153.2 ”简化 的 包头 


IPv6 的 包头 有 8 个 字段 。 它 与 IPv4 包头 的 不 同 在 于 ，IPv4 中 包含 至 少 12 个 不 同 字段 ， 
且 长 度 在 没有 选项 时 为 20 字 节 ， 但 在 包含 选项 时 可 达 60 字 节 。IPv6 使 用 了 固定 格式 的 包头 
并 减少 了 需要 检查 和 处 理 的 字段 的 数量 , 这 将 使 得 路 由 的 效率 更 高 。 包头 的 简化 使 得 他 的 某 
些 工 作 方式 发 生 了 变化 。 一 方面 ， 所 有 包头 长 度 统一 ， 因 此 不 再 需要 包头 长 度 字段 。 此 外 ， 
通过 修改 包 分 段 的 规则 可 以 在 包头 中 去 掉 一 些 字段 。 最 后 ,去 掉 IP 头 校 验 和 不 会 影响 可 靠 性 ， 
这 主要 是 因为 头 校 验 和 将 由 更 高 层 协议 (UDP 和 TCP) 负责 。 


15.3.3 ”对 扩展 和 选项 支持 的 改进 


在 IPv4 中 可 以 在 包头 的 尾部 加 入 选项 。 与 IPv4 不 同 的 是 , IPv6 把 选项 加 在 单独 的 扩展 
头 中 。 通 过 这 种 方法 ， 选 项 头 只 有 在 必要 的 时 候 才 需 要 检查 和 处 理 。 


15.3.4 流标 记 


在 IPv4 中 , 对 所 有 包 大 致 同 等 对 待 ， 路 由 器 按照 自己 的 方式 对 每 个 包 单独 进行 处 理 ， 不 
会 考虑 不 同 的 包 之 间 的 关系 。IPv6 实现 了 流 的 概念 。 流 指 的 是 从 一 个 特定 源 发 向 一 个 特定 目 
的 地 的 包 序 列 ， 源 点 希望 中 间 路 由 器 对 这 些 包 进行 特殊 处 理 。 因 此 ， 路 由 器 需要 有 办 法 区 分 
一 个 包 是 否 属于 同一 个 流 。 这 样 路 由 器 就 可 以 对 流 中 的 包 进 行 高 效 处 理 。 


15.3.5 ”身份 验证 和 保密 


IPv4 几乎 没有 对 数据 传输 的 安全 需求 作 任何 考虑 , 而 是 将 该 任务 交 给 了 上 层 协 议 或 应 用 
程序 。IPv6 定义 一 套 完整 的 安全 保障 措施 。IPv6 使 用 两 种 安全 性 扩展 : IP 身份 验证 头 (AH) 
和 下 封装 安全 数据 (ESP) 。 数 据 包 摘要 功能 通过 对 包 的 安全 可 靠 性 的 检查 和 计算 来 提供 身 
份 验证 功能 。 发 送 方 计算 数据 包 摘 要 并 把 结果 插入 到 身份 验证 头 中 ， 接 收 方 根据 收 到 的 数据 
包 摘 要 重新 进行 计算 ， 并 把 计算 结果 与 AH 头 中 的 数值 进行 比较 。 如 果 两 个 数值 相等 ， 接 收 
方 可 以 确认 数据 在 传输 过 程 中 没有 改变 ; 如 果 不 相等 ， 接 受 方 可 以 推测 出 数据 或 者 是 在 传输 
过 程 中 遭 到 了 破坏 ， 或 者 是 被 某 些 人 进行 了 故意 的 修改 。 封 装 安全 性 机 制 可 以 用 来 加 密 IP 
包 的 数据 ， 或 者 在 加 密 整 个 他 包 后 以 隧道 方式 在 Internet 上 传输 。 其 中 的 区 别 在 于 ， 如 果 只 
对 包 的 数据 进行 加 密 的 话 ， 包 中 的 其 他 部 分 (包头 ) 将 公开 传输 。 这 意味 着 破译 者 可 以 由 此 
确定 发 送 主机 和 接收 主机 以 及 其 他 与 该 包 相 关 的 信息 。 使 用 ESP 对 IP 进行 隧道 传输 意味 着 
对 整个 他 包 进行 加 密 ， 并 由 作为 安全 性 网 关 操 作 的 系统 将 其 封装 在 另 一 P 包 中 。 通 过 这 种 
方法 , 加 密 的 下 包 中 的 所 有 细节 均 被 隐藏 起 来 。 这 种 技术 是 创建 虚拟 专用 网 (VPN) 的 基础 ， 


TCP/IP 协议 及 网 络 编程 技术 


它 允 许 各 机 构 使 用 Intemet 作为 其 专用 骨干 网 络 来 共享 敏感 信息 。 


15.4 IPv6 数据 包 结 构 


本 节 将 给 出 IPv6 协议 数据 包 的 具体 格式 ， 并 对 其 中 的 部 分 新 的 概念 和 机 制作 出 详细 
说 明 。 


15.4.1 IPv6 数据 包 的 结构 


在 IPv4 中 ， 所 有 包头 以 32 位 为 单位 ， 即 4 个 八 位 字 。 而 在 IPv6 中 ， 包 头 以 64 位 为 单 
位 ， 且 包头 的 总 长 度 是 40 个 八 位 字 。 图 15.1 是 IPv6 数据 包 的 格式 示意 图 。 

版 本 字段 的 长 度 是 4 位 , 这 是 为 了 与 IPv4 HRA. 在 同一 个 网 络 上 可 以 同时 存在 两 种 不 同 
版 本 的 IP 协议 ， 通 过 该 字段 区 分 数据 包 是 哪个 版 本 的 ， 并 进行 不 同 的 处 理 。 业 务 流 类 别 字段 
的 长 度 为 8 位 ， 表 示 数 据 包 所 属 的 类 别 ， 路 由 器 可 以 为 不 同类 别 的 数据 包 提 供 不 同 的 服务 。 
默认 值 为 0。 流 标签 字段 的 长 度 为 20 位 ， 用 于 标识 属于 同一 业务 流 的 包 。 一 个 节点 可 以 同时 
作为 多 个 业务 流 的 发 送 源 。 流 标签 和 源 节点 地 址 惟一 标识 了 一 个 业务 流 。 数 据 长 度 字段 的 长 
FEA 16 位 ， 其 中 包括 包 数 据 的 长 度 ， 按 8 位 字 计 。 也 即 是 IPv6 头 后 的 包 中 包含 的 字 节 数 。 
这 意味 着 在 计算 数据 长 度 时 包含 了 IPv6 扩展 头 的 长 度 。 下 一 个 头 字段 指出 了 IPv6 头 后 所 跟 
的 头 字 段 中 的 协议 类 型 .其 作用 类 似 于 IPv4 的 协议 字段 ,可 以 用 来 指出 高 层 是 TCP 还 是 UDP， 
但 它 也 可 以 用 来 指明 IPv6 扩展 头 的 存在 。 跳 极限 字段 的 长 度 为 8 位 每 当 一 个 路 由 器 对 包 进 
行 一 次 转发 之 后 ， 这 个 字段 就 会 减 1。 如 果 该 字段 达到 0， 这 个 包 就 将 被 丢弃 。 这 和 IPv4 中 
的 TTL 字段 类 似 。 但 和 IPv4 不 同 的 是 ，IPv6 中 的 极限 跳 数 字段 并 不 代表 时 间 含义 ， 那 么 对 
数据 包 超 时 的 判断 可 以 由 高 层 协 议 完成 。 源 IP 地 址 和 目的 IP 地 址 字段 分 别 长 128 位 ， 是 两 
个 IPv6 的 他 地 址 。 
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15.4.2 IPv6 的 服务 类 型 和 流标 签 


IPv4 中 定义 了 一 个 服务 类 型 字段 ， 但 该 字段 在 实现 中 几乎 都 被 忽略 了 ， 无 法 起 到 为 不 同 
的 数据 包 提供 不 同 服务 的 作用 。IPv6 中 定义 了 一 个 业务 流 类 型 字段 。 使 用 业务 流 类 别 的 目的 
在 于 人 允许 发 送 业务 流 的 源 节点 和 转发 业务 流 的 路 由 器 在 包 上 加 上 标记 ， 并 进行 除 默认 处 理 方 
法 之 外 的 不 同 处 理 。 一 般 来 说 ， 在 所 选择 的 链 路 上 ， 可 以 根据 开销 、 带 宽 、 延 时 或 其 他 特性 
而 对 包 进 行 特 殊 的 处 理 。 

使 用 IPv4 的 路 由 器 在 转发 IP 数据 包 时 ， 是 根据 数据 包 本 身 的 目的 地 址 选择 路 径 进 行 转 
发 的 。 即 使 后 面 的 数据 包 和 前 面 的 是 到 达 同 一 个 地 址 的 ， 有 可 能 它们 到 达 目 的 地 所 经 过 的 路 
径 会 不 相同 。 这 对 于 适应 网 络 突 发 事件 来 说 是 个 好 办 法 ， 因 为 突 发 事件 意味 着 任何 一 条 路 由 
都 可 能 在 任何 时 间 出 现 故 障 ， 但 只 要 两 主机 间 存 在 某 些 路 由 则 可 以 进行 数据 的 交互 。 但 是 ， 
这 种 方法 的 效率 可 能 不 太 高 ， 因 为 数据 包 并 不 是 孤立 的 ， 一 个 主机 与 另 一 个 主机 通信 时 发 送 
的 数据 包 绝 大 多 数 时 都 不 止 一 个 。 如 果 已 经 为 这 次 通信 的 第 一 个 数据 包 选 好 了 路 径 ， 那 么 该 
通信 的 以 后 的 所 有 包 都 可 以 通过 这 条 路 径 到 达 目 的 地 ， 而 不 用 为 每 个 数据 包 都 进行 一 次 选 
择 。IPv6 中 流 的 概念 将 有 助 于 解决 类 似 问题 。 IPv6 头 字段 中 的 流标 签 把 单个 包 作 为 一 系列 源 
地 址 和 目的 地 址 相同 的 包 流 的 一 部 分 。 同 一 个 流 中 的 所 有 包 具 有 相同 的 流标 签 。 


154.3 IP 数据 包 的 分 片 


IPv6 的 分 片 只 能 由 源 节点 和 目的 节点 进行 ， 这 样 就 简化 了 包头 并 减少 了 用 于 路 由 的 开 
销 。Ipv4 的 逐 跳 分 片 是 一 种 有 害 的 方法 。 首 先 ， 它 在 端 到 端的 分 片 中 将 产生 更 多 的 分 片 。 此 
外 在 传输 中 ,一 个 分 片 的 丢失 将 导致 所 有 分 片 重 传 。 虽然 IPv4 在 使 用 了 分 片 之 后 , 不 论 中 间 
的 网 络 是 什么 类 型 ， 不 同类 型 网 络 上 的 节点 都 可 以 互 操作 ， 源 节点 无 需 了 解 任何 有 关 目 的 节 
点 网 络 的 信息 ， 同 时 也 无 需 了 解 它们 之 间 的 网 络 信息 。 这 一 直 被 认为 是 一 个 不 错 的 特性 ， 由 
于 不 需要 节点 或 路 由 器 存储 信息 或 记录 整个 Internet 的 结构 ， 从 而 可 以 获得 很 好 的 扩展 性 。 
但 另 一 方面 , 它 也 为 路 由 器 带 来 了 性 能 方面 的 问题 , 对 下 包 进行 分 片 消耗 了 沿途 路 由 器 和 目 
的 地 的 处 理 能 力 和 时 间 。 处 理 IP 数据 包 标 识 、 计 算 分 片 偏 移 值 、 真 正 把 数据 分 片 以 及 在 目的 
地 进行 重 装 都 会 带 来 额外 的 开销 。 问 题 在 于 对 于 任何 一 个 指定 的 路 由 器 ， 虽然 源 节点 能 够 了 
解 链 路 的 MTU 是 多 大 ,但 却 没有 办 法 事先 知道 整个 路 径 的 MTU。 然而,， 目 前 有 两 种 方法 可 
以 减少 或 消除 对 于 分 片 的 需求 。 第 一 种 方法 可 用 在 IPv4 中 ， 它 使 用 一 种 叫做 “路 径 MTU 发 
现 ” 的 方法 。 通过 这 种 方法 , 路 由 器 可 以 向 目的 地 发 送 一 个 包 来 报告 该 路 由 器 上 链 路 的 MTU 
值 。 如 果 包 到 达 了 一 条 必须 对 其 进行 分 片 的 链 路 ， 负 责 分 片 的 路 由 器 将 使 用 ICMP 回 送 一 个 
数据 包 来 指出 分 片 路 由 器 上 链 路 的 MTU 值 。 这 种 过 程 可 以 重复 进行 直到 路 由 器 确定 路 径 
MTU 为 止 。 另 一 种 方法 是 要 求 所 有 支持 IP 的 链 路 必须 能 够 处 理 一 些 合理 的 最 小 长 度 的 包 。 
换 名 话说， 如果 一 个 链 路 的 MTU 超过 20 字 节 ,那么 所 有 的 节点 都 必须 准备 产生 可 观 数量 的 
分 片 包 。 另 一 方面 ， 如 果 能 够 提出 所 有 网 络 链 路 都 可 以 适应 的 某 个 合理 的 长 度 ， 并 把 它 设 置 
为 允许 包 长 度 的 绝对 最 小 值 , 那么 就 可 以 消灭 分 片 . IPv6 中 实际 上 同时 使 用 了 上 面 两 种 方法 。 
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1544 扩展 头 


IPv4 选项 的 问题 在 于 改变 了 IP 头 的 大 小 ， 它 们 需要 特别 的 处 理 。 路 由 器 必须 优化 其 性 
能 , 这 意味 着 将 为 最 普遍 的 包 进行 最 佳 性 能 的 优化 。 这 使 得 IPv4 选项 引发 一 个 路 由 器 把 包含 
该 选项 的 包 搁置 一 边 ,等 到 有 时 间 的 时 候 再 进行 处 理 。IPv6 中 实现 的 扩展 头 可 以 消除 或 至 少 
大 量 减少 选项 带 来 的 对 性 能 的 冲击 。 通过 把 选项 从 IP 头 中 搬 到 数据 中 , 路 由 器 可 以 像 转 发 无 
选项 包 一 样 来 转发 包含 选项 的 包 。 除 了 规定 必须 由 每 个 转发 路 由 器 进行 处 理 的 逐 跳 选项 之 
外 ，IPv6 包 中 的 选项 对 于 中 间 路 由 器 而 言 是 不 可 见 的 。 可 用 的 选项 除了 减少 IPv6 包 转 发 时 
选项 的 影响 外 ，IPv6 规范 使 得 对 于 新 的 扩展 和 选项 的 定义 变 得 更 加 简单 。 在 需要 的 时 候 可 能 
还 会 定义 其 他 的 选项 和 扩展 。 

本 节 仅 简单 列 出 已 定义 的 扩展 : 

COD 逐 跳 选 项 头 。 此 扩展 头 必 须 紧 随 在 IPv6 头 之 后 。 它 包含 包 所 经 路 径 上 的 每 个 节点 
都 必须 检查 的 选项 数据 。 由 于 它 需 要 每 个 中 间 路 由 器 进行 处 理 ， 逐 跳 选 项 只 有 在 绝对 必要 的 
时 候 才 会 出 现 。 到 目前 为 止 ， 已 经 定义 了 两 个 选项 : 巨型 数据 选项 和 路 由 器 提示 选项 。 巨 型 
数据 选项 指明 包 的 数据 长 度 超过 IPv6 的 16 位 数据 长 度 字 段 。 只 要 包 的 数据 超过 65535 字 节 
(其 中 包括 逐 跳 选 项 头 ) ， 就 必须 包含 该 选项 。 如 果 节 点 不 能 转发 该 包 ， 则 必须 回 送 一 个 
ICMPv6 出 错 数据 包 。 路 由 器 提示 选项 用 来 通知 路 由 器 ，IPv6 数据 包 中 的 信息 希望 能 够 得 到 
中 间 路 由 器 的 查看 和 处 理 ， 即 使 这 个 包 是 发 给 其 他 某 个 节点 的 。 

(2) 路 由 头 。 此 扩展 头 指明 包 在 到 达 目 的 地 途中 将 经 过 哪些 节点 。 它 包含 包 沿途 经 过 
的 各 节点 的 地 址 列表 。IPv6 头 的 最 初 目的 地 址 是 路 由 头 的 一 系列 地 址 中 的 第 一 个 地 址 ， 而 不 
是 包 的 最 终 目的 地 址 。 此 地 址 对 应 的 节点 接收 到 该 包 之 后 ,对 IPv6 头 和 路 由 头 进行 处 理 ， 并 
把 包 发 送 到 路 由 头 列表 中 的 第 二 个 地 址 。 如 此 继续 ， 直 到 包 到 达 其 最 终 目的 地 。 

G) 分 段 头 。 此 扩展 头 包含 一 个 分 段 偏 移 值 、 一 个 “更 多 段 ”标志 和 一 个 标识 符 字 段 。 
用 于 源 节点 对 长 度 超出 源 端 和 目的 端 路 径 MTU 的 包 进 行 分 段 。 

(4) 目的 地 选项 头 。 此 扩展 头 代替 了 IPv4 选项 字段 。 目 前 ， 惟 一 定义 的 目的 地 选项 是 
在 需要 时 把 选项 填充 为 64 位 的 整数 倍 。 此 扩展 头 可 以 用 来 携带 由 目的 地 节点 检查 的 信息 。 

(5) 身份 验证 头 (AH) 。 此 扩展 头 提供 了 一 种 机 制 ， 对 IPv6 头 、 扩 展 头 和 数据 的 某 些 
部 分 进行 加 密 的 校 验 和 的 计算 。 

(6) 封装 安全 性 数据 (ESP) 头 。 这 是 最 后 一 个 扩展 头 ， 不 进行 加 密 。 它 指明 剩余 的 数 
据 已 经 加 密 ， 并 为 已 获得 授权 的 目的 节点 提供 足够 的 解密 信息 。 
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IPv6 对 他 协议 的 寻 址 方式 做 了 彻底 的 修改 ,而 不 是 仅仅 扩大 IP 地 址 空间 而 已 。IPv6 的 
这 种 改进 不 仅 提高 了 地 址 分 配 的 效率 ， 同 时 还 有 助 于 提高 IP 路 由 的 效率 。 本 节 将 仔细 研究 
IPv6 的 寻 址 方式 。 
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15.5.1 ”地 址 结构 与 寻 址 模式 


IPv4 与 IPv6 地 址 之 间 最 明显 的 差别 在 于 长 度 : IPv4 地 址 长 度 为 32 位 ， 而 IPv6 地 址 长 e 
度 为 128 位 。IPv4 地 址 可 以 分 为 2 至 3 个 不 同 部 分 (网 络 标识 符 、 节 点 标识 符 ， 有 时 还 有 子 
网 标识 符 ) ，IPv6 地 址 中 拥有 更 大 的 地 址 空间 ， 可 以 支持 更 多 的 字段 。IPv6 地 址 有 三 类 : 单 
播 、 多 播 和 泛 播 地 址 。 单 播 和 多 播 地 址 与 IPv4 的 地 址 非常 类 似 ; 但 IPv6 中 不 再 支持 IPv4 中 
的 广播 地 址 ， 而 增加 了 一 个 泛 播 地 址 。 

IPv4 地 址 一 般 以 4 部 分 间 点 分 的 方法 来 表示 ,， 即 4 数字 用 点 分 隔 。IPv6 地 址 的 基本 表达 
方式 是 X:X:X:X:X:X:X:X， 其 中 X 是 一 个 4 位 十 六 进 制 整数 C16 位 ) 。 例 如 ， 下 面 是 一 些 
合法 的 IPv6 地 址 : 

1A8D:127D:35FC:ABCD:47BC:1743:0210:45DA. 

3910:0:0:0:0:0:0:1 

请 注意 这 些 整 数 是 十 六 进 制 整数 。 这 是 一 种 比较 标准 的 IPv6 地 址 表达 方式 , 但 这 种 方式 
由 于 数据 太 多 不 便于 人 阅读 与 记忆 。 还 有 另外 两 种 更 加 清楚 和 易于 使 用 的 方式 。 某 些 IPv6 
地 址 中 可 能 包含 一 长 串 的 0〈 就 像 上 面 的 第 二 个 例子 一 样 ) 。 当 出 现 这 种 情况 时 ， 标 准 中 多 
许 用 “空隙 ”来 表示 这 一 长 串 的 0。 换 句 话说， 地 址 

3910:0:0:0:0:0:0:1 

可 以 表示 为 : 

3910::1 

这 两 个 冒号 表示 该 地 址 可 以 扩展 到 一 个 完整 的 128 位 地 址 。 在 这 种 方法 中 ， 只 有 当 16 
位 组 全 部 为 0 时 才 可 以 用 两 个 冒号 取代 , 且 两 个 冒号 在 地 址 中 只 能 出 现 一 次 。 TE IPv4 和 IPv6 
的 混合 环境 中 可 能 有 第 三 种 方法 。IPv6 地 址 中 的 最 低 32 位 可 以 用 于 表示 IPv4 地 址 ， 该 地 址 
可 以 按照 一 种 混合 方式 表达 ， 即 X:X:X:X:X:X:d.d.d.d， 其 中 义 表示 一 个 16 位 整数 ， 而 d 表 
示 一 个 8 位 十 进 制 整数 。 例 如 ， 地 址 

0:0:0:0:0:0:10.0.0.1 

就 是 一 个 合法 的 IPv4 地 址 。 把 两 种 可 能 的 表达 方式 组 合 在 一 起 ， 该 地 址 也 可 以 表示 为 : 

::10.0.0.1 

由 于 IPv6 Hi A ES 8843 TA A A, ee ATR A P 节点 
地 址 可 以 按照 类 似 CIDR 地 址 的 方式 表示 为 一 个 携带 额外 数值 的 地 址 ， 其 中 指出 了 地 址 中 
有 多 少 位 是 掩 码 。 即 IPvo 节点 地 址 中 指出 了 前 缀 长 度 ， 该 长 度 与 IPv6 地 址 间 以 斜 杠 区 分 ， 
例如 : 

1030:0:0:0:C9B4:FF12:48AA:1A2B/60 

这 个 地 址 中 用 于 路 由 的 前 缀 长 度 为 60 位 。 

IPv6 寻 址 模型 与 IPv4 很 相似 。 每 个 单 播 地 址 标识 一 个 单独 的 网 络 接口 。IP 地 址 被 指定 
给 网 络 接口 而 不 是 节点 , 因此 一 个 拥有 多 个 网 络 接口 的 节点 可 以 具备 多 个 IPv6 地 址 , 其 中 任 
何 一 个 IPv6 地 址 都 可 以 代表 该 节点 。 尽管 一 个 网 络 接口 能 与 多 个 单 播 地 址 相关 联 , 但 一 个 单 
播 地 址 只 能 与 一 个 网 络 接口 相关 联 。 每 个 网 络 接口 必须 至 少 具备 一 个 单 播 地 址 。 但 也 有 例外 。 

在 IPv4 中 , 所 有 的 网 络 接口 ,其 中 包括 连接 一 个 节点 与 路 由 器 的 点 到 点 链 路 (用 许多 拨 
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号 Internet 连接 中 ) ， 都 需要 一 个 专用 的 IP 地 址 。 随 着 许多 机 构 开始 使 用 点 到 点 链 路 来 连接 
其 分 支 机 构 ， 每 条 链 路 均 需 要 其 自己 的 子 网 ， 这 样 一 来 消耗 了 许多 地 址 空间 。 在 IPv6 中 ,如 
果 点 到 点 链 路 的 任何 一 个 端点 都 不 需要 从 非 邻居 节点 接受 和 发 送 数据 的 话 ， 它 们 就 可 以 不 需 
要 特殊 的 地 址 。 即 ， 如 果 两 个 节点 主要 是 传递 业务 流 ， 则 它们 并 不 需要 具备 IPv6 地 址 。 为 每 
个 网 络 接口 分 配 一 个 全 球 惟一 的 单 播 地 址 的 要 求 阻碍 了 IPv4 地 址 的 扩展 。 一 个 提供 通用 服务 
的 服务 器 在 高 需求 量 的 情况 下 可 能 会 崩溃 。 因 此 ，IPv6 地 址 模型 中 又 提出 : 如 果 硬 件 有 能 力 
在 多 个 网 络 接口 上 正确 地 共享 其 网 络 负载 的 话 ， 那 么 多 个 网 络 接口 可 以 共享 一 个 IPv6 地 址 。 
这 使 得 从 服务 器 扩展 至 负载 分 担 的 服务 器 群 成 为 可 能 ， 而 不 再 需要 在 服务 器 的 需求 量 上 升 时 
必须 进行 硬件 升级 。 


15.5.2 ”地 址 类 型 


IPv6 的 地 址 可 分 为 三 种 类 型 : 

单 播 : 一 个 单 接口 的 标识 符 。 送 往 一 个 单 播 地 址 的 包 将 被 传送 至 该 地 址 标识 的 接口 上 。 

泛 播 : 一 组 接口 (一 般 属于 不 同 节点 ) 的 标识 符 。 送 往 一 个 泛 播 地 址 的 包 将 被 传送 至 该 
地 址 标识 的 接口 之 一 根据 路 由 协议 对 于 距离 的 计算 方法 选择 “最 近 ” 的 一 个 )。 

多 播 : 一 组 接口 (一 般 属于 不 同 节点 ) 的 标识 符 。 送 往 一 个 多 播 地 址 的 包 将 被 传送 至 有 
该 地 址 标识 的 所 有 接口 上 。 

IPv6 将 IPv4 中 的 广播 地 址 类 型 去 除了 ， 并 添加 一 种 泛 播 地 址 类 型 。 
15.5.2.1 IPv4 广播 地 址 的 问题 


广播 用 来 携带 去 向 多 个 节点 的 信息 或 被 哪些 不 知 信息 来 自 何方 的 节点 用 来 发 出 请 求 。 但 
是 ， 广 播 可 能 会 给 网 络 性 能 设置 障碍 。 同 一 网 络 链 路 上 的 大 量 广播 意味 着 该 链 路 上 的 每 个 节 
点 都 必须 处 理 所 有 广播 ， 其 中 绝 大 部 分 节点 最 终 都 将 忽略 该 广播 ， 因 为 该 信息 与 自己 无 关 。 
把 广播 在 子 网 之 间 进 行 转发 将 导致 更 多 的 问题 ， 因 为 路 由 器 上 将 充斥 着 这 种 业务 流 。 

IPv6 对 此 的 解决 办 法 是 使 用 一 个 “所 有 节点 ”多 播 地址 来 替代 那些 必须 使 用 广播 的 情况 ， 
同时 , 对 那些 原来 使 用 了 广播 地 址 的 场合 , 则 使 用 一 些 更 加 有 限 的 多 播 地 址 。 通 过 这 种 方法 ， 
对 于 原来 由 广播 携带 的 业务 流感 兴趣 的 节点 可 以 加 入 一 个 多 播 地 址 ， 而 其 他 对 该 信息 不 感 兴 
趣 的 节点 则 可 以 忽略 发 往 该 地 址 的 包 。 广 播 从 来 不 能 解决 信息 穿越 Internet 的 问题 ， 如 路 由 
信息 ， 而 多 播 则 提供 了 一 个 更 加 可 行 的 方法 。 

15522 单 播 地 址 


单 播 地 址 标识 了 一 个 单独 的 IPv6 接口 。 一 个 节点 可 以 具有 多 个 IPv6 网 络 接口 。 每 个 接 
口 必须 具有 一 个 与 之 相关 的 单 播 地 址 。 单 播 地 址 包含 了 一 段 信息 ， 这 段 信息 包含 在 128 位 字 
段 中 : 该 地 址 可 以 完整 地 定义 一 个 特定 的 接口 。 此 外 ， 地 址 中 数据 可 以 解释 为 多 个 小 段 的 
信息 。 

IPv6 地 址 本 身 可 以 为 节点 提供 关于 其 结构 的 或 多 或 少 的 信息 , 这 主要 根据 是 由 谁 来 观察 
这 个 地 址 以 及 观察 什么 节点 可 能 只 需 简单 地 了 解 整个 128 位 地 址 是 一 个 全 球 惟一 的 标识 符 ， 
而 无 须 了 解 节点 在 网 络 中 是 否 存 在 。 另 一 方面 ， 路 由 器 可 以 通过 该 地 址 来 决定 ， 地 址 中 的 一 
部 分 标识 了 一 个 特定 网 络 或 子 网 上 的 一 个 惟一 节点 。 
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最 简单 的 方法 是 把 IPv6 地 址 作为 不 加 区 分 的 一 块 128 位 的 数据 ， 而 从 格式 化 的 观点 来 
看 ， 可 把 它 分 为 两 段 ， 即 接口 标识 符 和 子 网 前 级 。 

IPv6 单 播 地 址 包括 下 面 几 种 类 型 : 可 集聚 全 球 地 址 、 未 指定 地 址 或 全 0 地 址 、 回 返 地 址 、 
RA IPv4 地 址 的 IPv6 地 址 、 基 于 供应 商 和 基于 地 理 位 置 的 供应 商 地 址 、OSI 网 络 服务 访问 
点 CNSAP) 地 址 和 网 络 互联 包 交 换 (IPX) 地 址 。 


15.523 多 播 地 址 


IPv6 多 播 地 址 的 格式 不 同 于 IPv6 单 播 地 址 ， 它 将 128 位 的 地 址 分 为 几 个 固定 长 度 的 字 
段 。 地 址 格式 中 的 第 1 个 字 节 为 全 1， 表 示 其 为 多 播 地 址 。 多 播 地 址 占 了 IPv6 地 址 空间 的 整 
整 1256。 多 播 地 址 格式 中 除 第 1 字 节 外 的 其 余部 分 ， 包 括 如 下 三 个 字段 : 

(1) 标志 字段 : 长 4 位 。 目 前 只 指定 了 第 A 位 ， 该 位 用 来 表示 该 地 址 是 由 Internet 编 
号 机 构 指 定 的 熟知 的 多 播 地 址 ， 还 是 特定 场合 使 用 的 临时 多 播 地 址 。 如 果 该 标志 位 为 0， 
表示 该 地 址 为 熟知 地 址 ， 如 果 该 位 为 1， 表 示 该 地 址 为 临时 地 址 。 其 他 3 个 标志 位 保留 将 
来 用 。 

(2) 范围 字段 : 长 4 位 ， 用 来 表示 多 播 的 范围 。 即 ， 多 播 组 是 只 包括 同一 本 地 网 、 同 
一 站 点 、 同 一 机 构 中 的 节点 , 还 是 包括 IPv6 全 球 地 址 空间 中 任何 位 置 的 节点 。 该 4 位 的 可 能 
值 为 0 一 15。 

G) 组 标识 符 字段 : 长 112 位 ， 用 于 标识 多 播 组 。 根 据 多 播 地 址 是 临时 的 还 是 熟知 的 
以 及 地 址 的 范围 ， 同 一 个 多 播 标识 符 可 以 表示 不 同 的 组 。 永 久 多 播 地 址 用 指定 的 赋予 特殊 含 
义 的 组 标识 符 ， 组 中 的 成 员 既 依赖 于 组 标识 符 ， 又 依赖 于 范围 。 

15.524 泛 播 地 址 


多 播 地 址 在 某 种 意义 上 可 以 由 多 个 节点 共享 。 多 播 地 址 成 员 的 所 有 节点 均 期 待 着 接收 发 
给 该 地 址 的 所 有 包 。 一 个 连接 5 个 不 同 的 本 地 以 太 网 网 络 的 路 由 器 ， 要 向 每 个 网 络 转发 一 个 
多 播 包 的 副本 《假设 每 个 网 络 上 至 少 有 一 个 预订 了 该 多 播 地 址 ) 。 泛 播 地 址 与 多 播 地 址 类 似 ， 
同样 是 多 个 节点 共享 一 个 泛 播 地 址 , 不 同 的 是 , 只 有 一 个 节点 期 待 接收 给 泛 播 地 址 的 数据 包 。 
泛 播 对 提供 某 些 类 型 的 服务 特别 有 用 ， 尤 其 是 对 于 客户 机 和 服务 器 之 间 不 需要 有 特定 关系 的 
一 些 服务 ， 例 如 域名 服务 器 和 时 间 服 务 器 。 

泛 播 地 址 被 分 配 在 正常 的 IPv6 单 播 地 址 空间 以 外 。 因 为 泛 播 地 址 在 形式 上 与 单 播 地 址 无 
法 区 分 开 ， 一 个 泛 播 地 址 的 每 个 成 员 ， 必 须 显 式 地 加 以 配置 ， 以 便 识别 泛 播 地 址 。 

了 解 如 何 为 一 个 单 播 包 确 定 路 由 ， 必 须 从 指定 单个 单 播 地 址 的 一 组 主机 中 提取 最 低 的 公 
共 路 由 命名 符 。 即 ， 它 们 必定 有 某 些 公共 的 网 络 地 址 号 ， 并 且 其 前 级 定义 了 所 有 泛 播 节点 存 
在 的 地 区 。 比 如 一 个 ISP 可 能 要 求 它 的 每 一 个 用 户 机 构 提 供 一 个 时 间 服 务 器 ， 这 些 时 间 服 务 
器 共享 单个 泛 播 地 址 。 在 这 种 情况 下 ， 定 义 泛 播 地 区 的 前 级 ， 被 分 配给 ISP 作 再 分 发 用 。 发 
生 在 该 地 区 中 的 路 由 是 由 共享 泛 播 地 址 的 主机 的 分 发 来 定义 的 。 在 该 地 区 中 ， 一 个 泛 播 地 址 
必定 带 有 一 个 路 由 项 : 该 路 由 项 包括 一 些 指针 , 指向 共享 该 泛 播 地 址 的 所 有 节点 的 网 络 接口 。 
上 述 情况 下 ， 地 区 限定 在 有 限 范围 内 。 泛 播 主机 也 可 能 分 散在 全 球 Internet 上 ， 如 果 是 这 种 
情况 的 话 ， 那 么 泛 播 地 址 必须 添加 到 遍及 世界 的 所 有 路 由 表 上 。 
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15.6 Ipv6 的 安全 性 


IPv6 通过 使 用 身份 验证 头 CAED 和 封装 安全 性 数据 ESP) 头 来 实现 身份 验证 和 安全 性 ， 
包括 安全 密码 传输 、 加 密 和 数据 包 的 数字 签名 。 本 节 将 研究 IP. 安全 性 体系 结构 以 及 在 IPv6 
中 的 实现 机 制 。 


15.6.1 IP 协议 的 安全 目标 


IPv4 的 目的 只 是 作为 简单 的 网 络 互通 协议 ， 因 而 其 中 没有 包含 任何 安全 特性 。 对 于 安全 
性 ， 可 以 定义 如 下 3 个 公认 的 目标 。 

(1) 身份 验证 : 能 够 可 靠 地 确定 接收 到 的 数据 与 发 送 的 数据 一 致 ， 并 且 确 保 发 送 该 数 
据 的 实体 与 其 所 宣称 的 身份 一 致 。 

(2) 完整 性 : 能 够 可 靠 地 确定 数据 在 从 源 到 目的 地 传送 的 过 程 中 没有 被 修改 。 

G) 机 密 性 ;确保 数据 只 能 为 预期 的 接收 者 使 用 或 读 出 ， 而 不 能 为 其 他 任何 实体 使 用 
或 读 出 。 

完整 性 和 身份 验证 经 常 密切 相关 ， 而 机 密 性 有 时 使 用 公共 密 钥 加 密 来 实现 ， 这 样 也 有 助 
于 对 源 端 进行 身份 验证 。IPv6 的 AH 和 ESP 头 有 助 于 在 卫 上 实现 上 述 目标 。 很 简单 ，AH 为 
源 节点 提供 了 在 包 上 进行 数字 签名 的 机 制 。AH 之 后 的 数据 都 是 纯 文 本 格式 ， 可 能 被 攻击 者 
截取 。 但 是 , 在 目的 节点 接收 之 后 ,可 以 使 用 AH 中 包含 的 数据 来 进行 身份 验证 。 另 一 方面 ， 
可 以 使 用 ESP 头 对 数据 内 容 进行 加 密 。ESP 头 之 后 的 所 有 数据 都 进行 了 加 密 ，ESP 头 为 接收 
者 提供 了 足够 的 数据 以 对 包 的 其 余部 分 进行 解密 。 

Internet 安全 性 的 问题 在 于 很 难 创建 安全 性 , 尤其 是 在 开放 的 网 络 中 , 包 可 能 经 过 任意 数 
量 的 未 知 网 络 ， 任 一 个 网 络 中 都 可 能 有 包 嗅 探 器 在 工作 ， 而 任何 网 络 都 无 法 察觉 。 在 这 样 的 
开放 环境 中 , 即使 使 用 了 加 密 和 数字 签名 ， 安 全 性 也 将 受到 严重 的 威胁 。 对 IP 业务 流 的 攻击 
也 包括 诸如 侦 听 之 类 ， 致 使 从 一 个 实体 发 往 另 一 个 实体 的 数据 被 未 经 授权 的 第 三 个 实体 所 窃 
取 。 密 钥 管理 问题 则 更 加 复杂 。 为 使 身份 验证 和 加 密 更 可 靠 ，IP 安全 性 体系 结构 要 求 使 用 密 
钥 。 如 何 安全 地 管理 和 分 配 密 钥 ， 同 时 又 能 正确 地 将 密 钥 与 实体 结合 以 避免 中 间 者 的 攻击 ， 
这 是 Internet 业界 所 面临 的 最 棘手 的 问题 之 一 。 


15.6.2 IPsec 


IPsec 的 目标 是 提供 既 可 用 于 IPv4 也 可 用 于 IPv6 的 安全 性 机 制 ， 该 服务 由 IP 层 提供 。 
一 个 系统 可 以 使 用 IPsec 来 要 求 与 其 他 系统 的 交互 以 安全 的 方式 进行 一 一 通过 使 用 特定 的 安 
全 性 算法 和 协议 。IPsec 提供 了 必要 的 工具 ， 用 于 一 个 系统 与 其 他 系统 之 间 对 彼此 可 接受 的 
安全 性 进行 协商 。 即 系统 可 能 有 多 个 可 接受 的 加 密 算 法 ， 这 些 算法 允许 该 系统 使 用 它 所 倾向 
的 算法 和 其 他 系统 协商 ， 但 如 果 其 他 系统 不 支持 它 的 第 一 选择 ， 则 它 也 可 以 接受 某 些 蔡 代 算 
法 。IPsec 中 可 能 提供 如 下 安全 性 服务 : 

COD 访问 控制 。 如 果 没 有 正确 的 密码 就 不 能 访问 一 个 服务 或 系统 。 可 以 调用 安全 性 协 
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议 来 控制 密 钥 的 安全 交换 ， 用 户 身 份 验证 可 以 用 于 访问 控制 。 

(2) 无 连接 的 完整 性 。 使 用 IPsec， 有 可 能 在 不 参照 其 他 包 的 情况 下 ， 对 任 一 单独 的 他 
包 进 行 完 整 性 校 验 。 此 时 每 个 包 都 是 独立 的 ， 可 以 通过 自身 来 确认 。 此 功能 可 以 通过 使 用 安 
全 散 列 技术 来 完成 ， 它 与 使 用 检查 数字 类 似 ， 但 可 靠 性 更 高 ， 并 且 更 不 容易 被 未 授权 实体 所 
AK. 

G) 数据 源 身份 验证 。 IPsec 提供 的 又 一 项 安全 性 服务 是 对 TP 包 内 包含 的 数据 的 来 源 进 
行 标识 。 此 功能 通过 使 用 数字 签名 算法 来 完成 。 

(4) 对 包 重 放 攻 击 的 防御 。 作 为 无 连接 协议 ，IP 很 容易 受到 重 放 攻击 的 威胁 。 重 放 攻 
击 是 指 攻击 者 发 送 一 个 目的 主机 已 接收 过 的 包 ， 通 过 占用 接收 系统 的 资源 ， 这 种 攻击 使 系统 
的 可 用 性 受到 损害 。 为 对 付 这 种 攻击 ，IPsec 提供 了 包 计 数 器 机 制 。 

(5) 加 密 。 数 据 机 密 性 是 指 只 允许 身份 验证 正确 者 访问 数据 ， 对 其 他 任何 人 一 律 不 准 。 
它 是 通过 使 用 加 密 来 提供 的 。 

(6) 有 限 的 业务 流 机 密 性 。 有 时 只 使 用 加 密 数 据 不 足以 保护 系统 。 只 要 知道 一 次 加 密 
交换 的 末端 点 、 交 互 的 频 度 或 有 关 数 据 传送 的 其 他 信息 ， 坚 决 的 攻击 者 就 有 足够 的 信息 来 使 
系统 混乱 或 毁灭 系统 。 通 过 使 用 IP 隧道 方法 ， 尤 其 是 与 安全 网 关 共 同 使 用 ，IPsec 提供 了 有 
限 的 业务 流 机 密 性 。 

通过 正确 使 用 ESP 头 和 AH 头 ， 上 述 所 有 功能 都 有 可 能 得 以 实现 。 

安全 关联 (SA) 是 IPsec 的 基本 概念 。 安 全 性 关联 包含 能 够 惟一 标识 一 个 安全 性 连接 的 
数据 组 合 。 连 接 是 单方 向 的 ， 每 个 SA 由 目的 地 址 和 安全 性 参数 索引 (SPD 来 定义 。 其 中 
SPI 说 明 使 用 SA 的 IP 头 类 型 ， 如 AH BÈ ESP. SPI 为 32 位 ， 用 于 对 SA 进行 标识 及 区 分 同 
一 个 目的 地 址 所 链接 的 多 个 SA。 进 行 安全 通信 的 两 个 系统 有 两 个 不 同 的 SA， 每 个 目的 地 址 
对 应 一 个 。 每 个 SA 还 包括 与 连接 协商 的 安全 性 类 型 相关 的 多 个 信息 。 这 意味 着 系统 必须 了 
解 其 SA、 与 SA 目的 主机 所 协商 的 加 密 或 身份 验证 算法 的 类 型 、 密 钥 长 度 和 密 钥 生存 期 。 

IPsec 的 数据 传输 可 以 有 隧道 模式 和 透明 模式 两 种 。 两 个 通信 的 系统 直接 建立 了 SA。 其 
中 一 个 系统 产生 数据 ， 经 过 加 密 或 者 签名 ， 然 后 发 送 给 目的 系统 。 而 在 接收 方 ， 首 先 对 收 到 
的 数据 包 进 行 解密 或 者 身份 验证 ， 把 数据 向 上 传送 给 接收 系统 的 网 络 栈 ， 由 使 用 数据 的 应 用 
进行 最 后 的 处 理 。 两 个 主机 之 间 的 通信 如 同 没有 安全 头 一 样 简单 ， 而 且 数 据 包 实际 的 IP 头 必 
须要 暴露 出 来 以 便 进 行路 由 ， 这 种 方式 称 为 透明 模式 。 而 如 果 通 信 的 两 个 系统 之 间 不 是 直接 
进行 通信 的 ， 而 是 发 送 方 先 把 数据 发 送 到 一 个 安全 网 关 ， 由 它 和 另 一 个 安全 网 关 之 间 建 立 一 
条 安全 的 通道 并 将 数据 发 送 到 该 网 关 ， 接 收 网 关 再 将 数据 发 送 给 目的 系统 。 这 个 过 程 中 ， 真 
正 进 行 通信 的 两 个 系统 的 信息 不 会 暴露 在 传输 的 IP 头 中 .它们 的 通信 好 像 是 在 一 个 安全 的 通 
道中 进行 的 ， 所 以 称 为 隧道 模式 。 


15.6.3 IPv6 安全 头 


IPsec 安全 性 服务 完全 通过 AH 和 ESP 头 相 结合 的 机 制 来 提供 。 各 安全 头 可 以 单独 使 用 ， 
也 可 以 一 起 使 用 。 如 果 一 起 使 用 多 个 扩展 头 ，AH 应 置 于 ESP 头 之 前 ， 这 样 ， 首 先进 行 身份 
验证 ， 然 后 再 对 ESP 头 数据 解密 。 使 用 IPsec 隧道 时 ， 这 些 扩展 头 也 可 以 嵌 套 。AH 和 ESP 
头 既 可 以 用 于 IPv4， 也 可 以 用 于 了 Pv6。 本 节 将 讨论 这 些 安全 性 扩展 头 在 IPv6 中 的 使 用 方式 
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和 工作 机 制 。 
15.6.3.1 AH X 


AH 的 作用 包括 如 下 : 
COD 为 他 数据 包 提供 强大 的 完整 性 服务 ， 即 AH 可 用 于 为 IP 数据 包 验 证 数据 。 
COD 为 他 数据 包 提 供 身份 验证 ， 即 AH 可 用 于 将 实体 与 数据 包 内 容 相 链 接 。 
G) 如 果 在 完整 性 服务 中 使 用 了 公共 密 钥 数字 签名 算法 ，AH 可 以 为 P 数据 包 提供 不 
可 否认 服务 。 
(4) 通过 使 用 顺序 号 字段 来 防止 重 放 攻击 。 

AH 可 以 在 隧道 模式 或 透明 模式 下 使 用 。 它 既 可 用 于 为 两 个 节点 间 的 简单 直接 的 数据 包 
传送 提供 身份 验证 和 保护 ， 也 可 用 于 对 发 给 安全 性 网 关 或 由 安全 性 网 关 发 出 的 整个 数据 包 流 
进行 封装 。 

IPv6 中 的 AH 与 其 他 扩展 头 一 起 使 用 时 ， 必 须 置 于 那些 将 由 中 间 路 由 器 处 理 的 扩展 头 之 
后 ， 并 在 只 能 由 数据 包 目 的 地 处 理 的 扩展 头 之 前 。 在 透明 模式 中 ，AH 保护 初始 IP 数据 包 的 
数据 ， 也 保护 在 逐 跳 转发 中 不 变化 的 部 分 他 头 ， 如 跳 极 限 字 段 或 路 由 扩展 头 。 当 AH 用 于 隧 
道 模式 中 时 ， 使 用 方法 与 上 不 同 ， 整 个 初始 IP 数据 包 以 及 传送 中 不 变 的 封装 IP. 头 部 分 都 应 
该 保护 。 
15.6.3.2 ESP X 


ESP 头 允 许 IP 节点 发 送 和 接收 数据 经 过 加 密 的 数据 包 。ESP 头 可 以 提供 下 列 几 种 服务 : 
CD 通过 加 密 提 供 数据 包 的 机 密 性 。 
(2) 通过 使 用 公共 密 钥 加 密 对 数据 来 源 进行 身份 验证 。 
(3) 通过 由 AH 提供 的 序列 号 机 制 提供 对 抗 重 放 服 务 。 
(4) 通过 使 用 安全 性 网 关 来 提供 有 限 的 业务 流 机 密 性 。 
ESP 头 可 以 和 AH 结合 使 用 。 实 际 上 ， 如 果 ESP 头 不 使 用 身份 验证 的 机 制 就 应 该 将 AH 
和 ESP 头 一 起 使 用 。 
ESP 头 必须 跟随 在 去 往 目的 节点 所 途经 的 中 间 节 点 需要 处 理 的 扩展 头 之 后 ，ESP 头 之 后 
的 数据 都 可 能 被 加 密 。ESP 既 可 用 于 隧道 模式 ， 也 可 用 于 透明 模式 。 在 透明 模式 中 ， 如 果 有 
AH, IP 头 以 及 逐 跳 扩展 头 、 路 由 扩展 头 或 分 段 扩展 头 都 在 AH 之 前 ， 其 后 跟随 ESP 3k. ff 
何 目的 地 选项 头 可 以 在 ESP 头 之 前 ， 也 可 以 在 ESP 头 之 后 ， 或 者 ESP 头 前 后 都 有 ， 而 ESP 
头 之 后 的 扩展 头 将 被 加 密 。 
在 很 多 方面 ， 仅 仅 是 常规 数据 包 带 着 加 密 数 据 从 源 端 传送 到 目的 端 。 某 些 情况 下 ， 适 合 
在 透明 模式 中 使 用 ESP。 但 是 ， 这 种 模式 使 攻击 者 有 可 能 研究 两 个 节点 之 间 的 业务 流 ， 留 意 
正在 通信 的 节点 、 节 点 之 间 交 换 的 数据 量 、 交 换 的 时 间 等 。 所 有 这 些 信 息 都 可 能 为 攻击 者 提 
供 有 助 于 对 通信 双方 进行 攻击 的 信息 。 类 似 前 面 描述 的 AH 的 情形 ， 使 用 安全 性 网 关 是 一 种 
替代 方法 。 安 全 性 网 关 可 以 直接 与 节点 连接 ， 也 可 以 链接 到 另 一 个 安全 性 网 关 。 单 个 节点 可 
以 在 隧道 模式 中 使 用 ESP， 即 加 密 所 有 出 境 包 ， 并 封装 到 单独 的 IP 数据 包 流 中 ， 再 发 送 给 安 
全 性 网 关 。 然 后 网 关 解 密 业务 流 ， 并 重新 将 原始 IP 数据 包 发 往 目的 地 。 使 用 隧道 模式 时 ， 
ESP 头 对 整个 IP 数据 包 进 行 封装 ， 并 作为 P 头 的 扩展 将 数据 包 定 向 到 安全 性 网 关 。ESP 头 
与 AH 的 结合 也 有 几 种 不 同方 式 ， 例 如 以 隧道 方法 传送 的 数据 包 可 能 有 透明 模式 的 AH。 
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15.7 IP 协议 的 升级 对 其 他 协议 的 影响 


TCP/IP 协议 族 分 为 四 层 ， 现 在 对 P 协议 进行 了 升级 ， 会 不 会 对 其 他 的 各 层 协议 造成 影 
响 ， 并 要 求 其 也 进行 相应 的 升级 呢 ? 本 节 将 从 整体 上 看 这 个 问题 ， 但 不 会 就 每 种 具体 的 协议 
进行 讨论 。 

首先 是 物理 网 络 层 。 物理 层 协议 由 于 IP. 协议 的 升级 而 受到 的 影响 很 小 。 这 是 由 于 这 些 协 
议 只 是 将 上 层 数据 包 封装 到 物理 层 帧 中 。 但 这 并 不 说 明 IPv6 对 物理 层 协 议 毫 无 影响 。 例 如 ， 
ATM 使 用 类 似 点 到 点 连接 来 跨越 网 络 传送 数据 ， 对 于 需要 将 IPv6 包 交付 多 个 节点 的 服务 ， 
ATM 需要 格外 注意 。 可 能 受 IPv6 影响 的 物理 层 问题 还 包括 路 径 MTU 发 现 及 地 址 解析 协议 

CARP) ， 这 些 协议 需要 修改 以 支持 128 位 的 IPv6 地 址 。 

其 次 是 传输 层 。IP 层 与 传输 层 协议 的 关系 最 密切 ， 因 为 传输 层 的 实现 是 基于 IP. 协议 提 
供 的 服务 的 。 传 输 层 中 ，UDP 和 TCP 的 伪 头 部 都 使 用 了 源 IP 地 址 和 目的 TP 地 址 ， 而 且 TCP 
的 连接 是 由 源 节点 和 目的 节点 的 IP 地址 和 端口 号 来 定义 的 。 如 果 要 与 IPv6 互 操 作 ， 至 少 要 
修改 UDP 和 TCP， 以 适应 128 位 IPv6 地 址 。 另 外 ， 因 为 IPv6 支持 移动 卫 ， 而 目前 TCP 在 
处 理 移动 节点 时 有 一 点 问题 ， 确定 TCP 连接 需要 源 节 点 和 目的 节点 的 IP 地 址 。 如 果 在 TCP 
交互 期 间 , 一 方 或 双方 的 了 P 地 址 有 所 改变 , 则 连接 的 标识 就 会 出 现 问题 。 移 动 节点 从 一 个 网 
络 地 址 向 另 一 个 网 络 地 址 转换 时 就 会 出 现 这 种 情况 , 这 种 问题 的 产生 是 由 于 TCP 至 少 在 目前 
还 没有 机 制 能 允许 在 连接 中 改变 IP 地 址 。 如 果 一 个 节点 收 到 的 TCP 段 中 的 源 IP 地 址 与 此 
TCP 连接 在 建立 时 协商 的 地 址 不 同 , 该 节点 将 认为 这 个 TCP 段 是 属于 另 一 个 连接 的 。 解 决 这 
个 问题 比 简单 地 允许 TCP 连接 支持 网 络 地 址 转换 要 复杂 许多 。 因 为 支持 这 样 的 地 址 转换 将 导 
致 安全 性 漏洞 :攻击 者 很 容易 冒充 从 一 个 网 络 向 另 一 个 网 络 转换 的 节点 ， 如 同 授权 的 节点 从 

个 网 络 向 另 一 个 网 络 转换 一 样 。 解决 这 样 的 问题 将 要 求 对 TCP 进行 重大 的 升级 , 即 需 要 引 
入 机 制 使 节点 在 其 TP 地 址 改变 时 能 向 其 他 节点 证 明 自 己 。 

最 后 是 应 用 层 。 由 于 很 多 与 TCP/IP 协议 相关 的 应 用 在 其 实现 或 参数 设置 都 直接 使 用 或 
允许 直接 使 用 IP 地址。 现在 IPv6 将 地 址 增加 到 了 128 位 ， 所 以 这 些 应 用 显然 需要 进行 更 新 。 
而 且 , 现在 IPv6 提供 更 好 的 的 安全 性 、 服 务 质量 或 其 他 特性 的 服务 ， 有 些 应 用 希望 使 用 IPv6 
服务 ， 这 样 就 需要 更 广泛 的 更 新 。 


(ty 
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本 章 将 介绍 目前 常见 的 操作 系统 中 的 TCP/IP 协议 栈 的 实现 机 制 。 当 然 ， 无 法 概括 各 系 
统 实现 的 所 有 细节 问题 ， 也 无 法 包括 所 有 的 操作 系统 。 只 讨论 Windows 和 Unix/Linux 中 
TCP/IP 协议 栈 的 整体 体系 结构 及 一 些 重要 的 具体 机 制 。 由 于 它们 的 实现 有 很 多 相同 之 处 , 我 
们 将 大 部 分 的 篇 幅 都 安排 在 讲述 Windows 的 TCP/IP 实现 上 ， 这 主要 是 因为 本 书 在 第 2 部 分 
讲述 Internet 编程 技术 时 都 是 以 Windows 平台 为 例 进 行 说 明 的 。 在 这 里 先 让 读者 了 解 
Windows 的 TCP/IP 的 整体 结构 和 功能 ， 方 便 读者 对 本 书 第 2 部 分 的 理解 。 对 Unix/Linux 中 
TCP/IP 实现 的 详细 信息 ， 可 以 参考 相关 的 文档 和 参考 资料 。 


16.1 Windows 的 TCP/IP 实现 


Windows 操作 系统 作为 当今 最 主流 的 操作 系统 ， 对 企业 网 络 传输 起 着 巨大 的 作用 。 
Microsoft Windows 上 的 允许 企业 级 互联 和 基于 Windows 平台 之 间 的 计算 机 建立 连接 。 在 
Windows 中 添加 TCP/IP 能 获得 如 下 的 功能 : 

(1) 一 个 标准 的 、 可 以 路 由 的 企业 网 络 互联 协议 ， 也 是 可 用 协议 中 最 完整 和 最 为 大 众 
所 接受 的 。 所 有 的 现代 网 络 操作 系统 都 支持 TCP/IP， 大 型 网 络 的 大 部 分 网 络 通信 都 依赖 于 
TCP/IP. 

(2) 一 种 连接 不 同系 统 的 技术 。 许 多 标准 的 连接 程序 可 以 用 来 在 不 同系 统 之 间 访 问 和 
传输 数据 ， 包 括 文件 传输 协议 (FTP) 和 Telnet (一 种 终端 仿真 协议 ) Windows 包括 几 个 
这 样 的 标准 程序 。 

(3) 一 个 健壮 的 、 可 扩展 的 、 跨 平台 的 客户 /服务 器 框架 。Microsoft TCP/IP 提供 Windows 
套 接 字 接口 ， 它 是 理想 的 客户 机 /服务 器 应 用 程序 开发 工具 ， 能 在 其 他 厂商 的 与 Windows 套 
接 字 兼 容 的 协议 栈 上 运行 。 

(4) 一 种 访问 Internet 的 方法 。Internet 包括 成 千 上 万 的 世界 性 网 络 、 互 联 的 研究 机 构 、 
大 学 、 图 书馆 和 公司 。 

Windows TCP/IP 的 核心 协议 元 素 、 服 务 及 它们 之 间 的 接口 如 图 16.1 所 示 。 传 输 驱 动 程 
FEO (TDD 和 网 络 设备 接口 规范 CNDIS) 是 公共 的 ， 有 关 它 们 的 描述 可 以 从 Microsoft 
公司 得 到 。 另 外 ， 还 有 许多 高 层 接口 可 供用 户 模式 的 应 用 程序 使 用 。 最 常用 的 有 Windows 
套 接 字 、 远 程 过 程 调用 (RPC) 和 NetBIOS. KAKF Windows 套 接 字 的 更 多 信息 ， 参 见 本 
书 第 2 部 分 。 

下 面 ， 按 照 自 底 向 上 的 顺序 逐一 说 明 Windows 平台 下 的 TCP/IP 协议 栈 。 
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16.11 Windows TCP/IP 协议 栈 组 成 元 素 及 服务 接口 


16.1.1 ”物理 链 路 层 


Windows 网 络 协议 使 用 网 络 设备 接口 规范 (NDIS〉 网 卡 驱动 程序 进行 通信 。 开 放 系 统 
互联 (OSI) 模型 中 数据 链 路 层 的 大 部 分 功能 都 在 该 协议 栈 中 实现 ， 这 使 得 开发 网 卡 驱 动 程 
序 更 简单 。NDIS5.0 包括 以 下 扩展 功能 : 

O NDIS 电源 管理 (网 络 电源 管理 和 网 络 唤醒 需要 此 功能 )。 

o BRM. 

口 ”对 诸如 TCP 和 UDP 校 验 和 之 类 任务 的 任务 分 载 机 制 和 快速 包 转 发 。 

O 支持 QoS。 

O “支持 中 间 驱 动 器 〈 广 播 式 PC)， 虚 拟 局 域 网 (VLAN)， 面 向 QoS 的 包 调度 ，NDIS 

〈 对 IEEE1394 网 络 设备 的 支持 都 需要 此 功能 )。 

当 系 统 请 求 电源 级 别 改变 时 ，NDIS 就 能 切断 网 络 适 配器 的 电源 。 用 户 或 系统 都 能 启动 
该 请 求 。 例 如 : 用 户 可 能 想 使 计算 机 进入 睡眠 状态 ， 或 者 系统 可 能 因为 键盘 或 鼠标 不 活动 而 
请 求 改 变 电 源 级 别 。 另 外 ， 如 果 网 络 适 配器 支持 的 话 ， 断 开 网 络 连 线 也 能 启动 该 请 求 。 在 这 
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种 情况 下 ， 系 统 会 在 切断 网 络 适配器 电源 之 前 等 待 一 段 可 配置 的 时 间 ， 因 为 连接 断 开 可 能 只 
是 网 络 中 临时 线路 改变 的 结果 ， 并 非 真 的 断 开 电缆 与 网 络 的 连接 。 

NDIS 电源 管理 策略 的 前 提 是 没有 网 络 活动 。 这 意味 着 在 切断 网 络 适 配器 电源 之 前 ， 所 
有 上 层 网 络 组 件 必须 同意 该 请 求 。 如 果 网 络 上 还 存在 活动 会 话 或 者 打开 的 文件 ， 断 电 请 求 就 
会 被 其 中 一 个 或 所 有 相关 组 件 拒绝 。 

计算 机 也 能 被 网 络 事件 从 低 电 源 级 别 中 唤醒 ， 以 下 情况 会 导致 唤醒 信号 。 

口 “ 检 测 到 网 络 链 路 状态 的 改变 〈 例 如 ， 电 费 重 新 连 上 )。 

O “接收 到 网 络 唤醒 帧 。 

口 接收 到 巨 包 (Magic Packet)， 巨 包 是 包含 连续 16 个 接收 方 网 络 适配器 介质 访问 

(MAC) 地 址 复制 的 数据 包 。 

在 驱动 器 初始 化 时 ，NDIS 查询 微 端 口 驱动 器 的 能 力 以 判定 是 否 支持 诸如 巨 包 、 模 式 匹 
配 和 链 路 状态 改变 唤醒 等 唤醒 方式 ， 并 决定 每 种 唤醒 方式 所 要 求 的 最 低 电 源 状态 。 然 后 ， 网 
络 协议 就 只 需 查 询 微 端口 的 能 力 ， 在 运行 时 ， 协 议 设置 使 用 对 象 标识 符 的 唤醒 策略 ， 例 如 启 
用 唤醒 、 设 置 包 模 式 和 删除 包 模 式 等 。 

目前 ，Windows TCP/IP 支持 网 络 电源 管理 。 它 在 微 端 口 初始 化 时 注册 如 下 包 模 式 。 

DO HRP. 

D “请求 站 IP 地 址 的 ARP 广播 。 

O 请求 站 计算 机 名 的 TCP/IP 上 的 广播 。 

与 NDIS 兼容 的 驱动 程序 适用 于 不 同 厂家 的 各 种 各 样 的 网 络 适配器 。NDIS 接口 允许 不 
同类 型 的 多 个 协议 驱动 程序 绑 定 到 同一 个 网 络 适 配器 驱动 程序 ， 也 允许 将 同一 个 协议 绑 定 到 
多 个 网 络 适配器 驱动 程序 上 。NDIS 规范 描述 了 实现 这 一 点 的 多 路 复 用 机 制 。 绑 定 可 以 通过 
Windows 网 络 或 拨号 连接 文件 夹 查看 和 改变 。 

Windows TCP/IP 对 以 下 技术 提供 支持 : 光纤 分 布 式 数据 接口 (FDDI) 、 令 牌 环 

(IEEE802.5) 、 蜡 步 传输 模式 (ATM) 。 

链 路 层 功能 分 布 在 网 络 适配器 /驱动 程序 组 合 和 低层 协议 栈 驱动 程序 上 。 对 LAN 介质 ， 
网 络 适 配器 /驱动 程序 组 合 的 过 滤 功 能 基于 帧 的 目的 MAC 地 址 。 正常 情况 下 , LAN 硬件 过 滤 
掉 目 的 地 址 不 是 以 下 地 址 之 一 的 所 有 来 帧 。 

DO ”适配器 的 单 播 MAC 地 址 。 

O 广播 地 址 (对 以 太 网 ， 广 播 地 址 是 OKFFFFFFFFFFFF )。 

口 ” 通 过 协议 驱动 程序 利用 硬件 注册 的 多 播 地 址 。 

如 果 某 个 帧 将 这 些 地 址 之 一 作为 其 目的 MAC 地 址 ， 就 能 通过 计算 校 验 和 来 检查 该 帧 的 
比特 级 完整 性 。 所 有 通过 了 目的 地 址 校 验 和 检查 的 帧 ， 都 通过 硬件 中 断 提 交 给 网 络 适 配器 驱 
动 程序 。 网 络 适配器 驱动 程序 是 在 计算 机 上 运行 的 软件 ， 因 此 ， 接 收 任何 帧 都 需要 一 定 的 
CPU 处 理 时间 。 网 络 适配器 驱动 程序 再 通过 接口 卡 把 帧 送 入 系统 内 存 , 然后 再 按 组 成 帧 时 的 
顺序 提交 给 特定 的 绑 定 传输 驱动 程序 。NDIS5.0 规范 提供 了 该 过 程 的 更 多 细节 。 

当 一 个 包 经 过 一 个 或 一 系列 网 络 时 ， 其 源 MAC 地 址 是 把 该 包 放 到 传输 介质 上 的 网 络 适 
配器 的 MAC 地 址 , 而 它 的 目的 MAC 地 址 总 是 通过 该 传输 介质 欲 到 达 的 网 络 适 配器 的 MAC 
地 址 。 这 意味 着 在 路 由 网 络 中 ， 源 和 目的 MAC 地 址 在 经 过 网 络 层 设备 (路 由 器 或 第 三 层 交 
换 机 ) 的 每 一 段 时 会 改变 。 
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16.1.2 IP 层 


IP 层 的 功能 是 收发 PP 数据 包 ， 在 IP 层 ， 除 了 实现 卫 协议 外 ， 还 实现 了 ARP. RARP 
和 ICMP 等 协议 。 下 面 分 别 进行 介绍 。 
16.1.2.1 ARP 


地 址 解析 协议 CARP) 为 外 出 包 进 行 IP 地 址 到 介质 访问 控制 地 址 的 解析 。 将 外 出 数据 报 
封装 成 帧 时 ， 必 须 填 上 其 源 和 目的 MAC 地 址 。 决 定 帧 的 目的 MAC 地 址 是 ARP 的 任务 。 在 
了 P 路 由 选择 过 程 中 ， 一 个 外 出 IP 数据 报 将 选择 接口 〈 网 络 适配器 ) 和 转发 他 地 址 。 对 外 出 
下 数据 报 , ARP 将 其 转发 卫 地 址 与 ARP 高 速 缓存 进行 比较 , 以 查找 包 将 发 往 的 网 络 适 配器 。 
如 果 有 匹配 项 ， 就 使 用 从 高 速 缓存 中 得 到 的 MAC 地 址 ， 如 果 没有 ，ARP 就 在 本 地 子 网 上 广 
播 ARP 请 求 帧 ， 要 求 拥有 所 查询 IP 地 址 者 回 送 它 的 MAC 地 址 。 当 收 到 ARP 响应 时 ， 就 以 
新 信息 更 新 ARP 高 速 缓存 ， 并 用 它 作 为 包 的 数据 链 路 层 地 址 。 

Windows 能 根据 系统 要 求 自动 调整 ARP 高 速 缓存 的 大 小 。 如 果 一 个 表 项 两 分 种 内 未 被 
任何 外 出 数据 报 使 用 ， 就 从 ARP 高 速 缓 存 中 删除 掉 。 被 访问 过 的 表 项 赋 以 追加 时 间 ， 每 次 
增加 2 分钟 ， 直 到 最 大 生命 值 时 间 10 分 钟 。10 分 钟 后 ， 就 从 ARP 高 速 缓存 中 删除 该 表 项 ， 
如 果 要 继续 使 用 ， 必 须 通过 ARP 请 求 帧 重新 查找 。 

除了 通过 接收 ARP 应 答 来 创建 ARP 高 速 缓存 表 项 外 , 也 能 根据 从 ARP 请 求 中 得 到 的 映 
射 信息 来 更 新 ARP 表 项 。 换 句 话说 ， 如 果 ARP 请 求 发 送 者 的 IP 地 址 在 高 速 缓存 中 ， 就 用 发 
送 者 的 MAC 地 址 更 新 表 项 。 通 过 这 种 方法 ， 含 有 发 送 者 的 静态 或 动态 ARP 高 速 缓存 表 项 的 
结 点 ， 可 以 用 发 送 者 的 当前 MAC 地 址 进行 更 新 。 接 口 或 MAC 地 址 发 生 改 变 的 结 点 将 更 新 
ARP 高 速 缓存 ， 使 其 含有 本 结 点 下 次 发 送 ARP 请 求 时 要 用 到 的 表 项 。 

在 将 目的 也 地 址 解析 成 MAC 地 址 时 ，ARP 仅 能 对 一 个 外 出 IP 数据 报 进行 排队 。 如 果 
基于 UDP 的 应 用 程序 连续 地 向 同一 目标 地 址 发 送 多 个 TP 数据 报 ， 某 些 数据 报 会 因为 不 存在 
相应 ARP 高 速 缓存 表 项 而 被 丢弃 。 
16.1.2.2 IP 3&d 


路 由 选择 是 IP 层 的 基本 功能 。 数 据 报 经 由 网 络 适配器 提交 给 IP. ESR AAA 
目的 IP 地 址 。 卫 模块 检查 每 个 数据 报 的 目的 地 址 ， 并 与 本 地 维持 的 TP 路 由 表 作 比较 ， 以 决 
定 采取 什么 行动 。 对 每 个 数据 报 ， 都 有 3 种 可 能 : 提交 给 本 地 主机 IP 层 之 上 的 高 层 协议 、 通 
过 本 地 某 一 网 络 适 配器 转发 、 丢 弃 。 

Windows IP 路 由 表 的 每 个 表 项 包含 如 下 信息 。 

O 目的 网 络 : 路 由 对 应 的 网 络 ID。 目 的 网 络 可 以 是 分 类 地 址 、 子 网 、 超 网 或 主机 路 由 
的 下 地 址 。 

子 网 掩 码 : 掩 码 用 来 匹配 目的 他 地址 和 目的 网 络 。 

网 关 : 到 目的 网 络 的 转发 IP 地 址 或 下 一 路 程 段 的 人 P 地 址 。 

接口 : 网 络 接口 对 应 的 下 地址， 用 于 转发 中 数据 报 。 

度量 : 标示 路 由 代价 的 数字 ， 利 用 它 可 以 在 到 达 同 一 目的 地 的 多 条 路 由 中 选择 一 条 
最 佳 的 。 通 常 采用 的 度量 是 到 目的 网 络 的 路 程 段 数 〈 经 过 的 路 由 器 数 )。 

如 果 两 条 路 由 有 相同 的 目的 网 络 和 子 网 掩 码 ， 度 量 较 小 的 路 由 就 是 最 佳 路 由 。 路 由 表 项 
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可 用 来 存储 以 下 类 型 的 路 由 。 
O ”直接 相连 网 络 ID 的 路 由 : 这 些 路 由 用 于 直接 相连 的 网 络 ID 。 对 直接 相连 的 网 络 而 
言 ， 网 关 的 IP 地 址 就 是 该 网 络 接口 的 IP 地 址 。 
C) “远程 网 络 ID 的 路 由 : 这 些 路 由 用 于 那些 不 直接 相连 、 但 通过 其 他 路 由 器 可 达 的 网 
络 ID。 对 远程 网 络 而 言 ， 网 关 IP 地 址 就 是 位 于 转发 结 点 和 远程 网 络 之 间 的 本 地 路 
由 器 的 他 地址。 
O 主机 路 由 : 面向 特定 IP 地 址 的 路 由 。 主 机 路 由 允许 在 每 个 IP 地 址 的 基础 上 进行 路 
由 选择 。 对 主机 路 由 而 言 ， 目 的 网 络 就 是 特定 主机 的 IP 地 址 ， 子 网 掩 码 为 
255.255.255255. 
O ”默认 路 由 : 默认 路 由 在 未 能 找到 特定 网 络 ID 或 主机 路 由 的 情况 下 使 用 。 默 认 路 由 
的 目的 网 络 是 0.0.0.0， 子 网 掩 码 为 0.0.0.0。 
要 决定 一 条 转发 人 P 数据 报 的 路 由 ，IP 模块 使 用 如 下 过 程 。 
DO ”对 路 由 表 中 的 每 条 路 由 ，IP 模块 将 目的 IP 地 址 与 子 网 掩 码 进行 按 位 逻辑 “与 ” 操 
作 ， 并 将 结果 与 目的 网 络 进行 匹配 ， 如 果 匹 配 的 话 ， 卫 就 将 该 路 由 标记 为 目的 IP 
地 址 的 匹配 路 由 。 
O IP 从 所 有 匹配 路 由 中 选择 子 网 掩 码 位 数 最 多 的 路 由 。 该 路 由 与 目的 IP 地 址 相 匹配 
的 位 数 最 多 , 因而 也 是 对 该 TP 数据 报 最 特殊 的 路 由 。 这 就 是 所 谓 寻找 最 长 或 最 接近 
匹配 的 路 由 。 
口 ” 如 果 找 到 多 条 最 接近 匹配 路 由 ， 卫 就 选取 度量 最 小 的 。 
O ”如 果 找 到 多 条 带 最 小 度量 的 最 接近 匹配 路 由 ， 卫 就 从 中 随机 选取 一 个 。 
在 选 定 的 路 由 上 决定 转发 IP 地 址 或 下 一 路 程 段 的 IP 地 址 时 ， 卫 模块 使 用 如 下 过 程 。 
口 ”、 如 果 网 关 地 址 与 接口 地 址 相同 ， 就 将 转发 他 地 址 设 为 卫 包 的 目的 了 瑟 地 址 。 
口 ”、 如 果 网 关 地 址 与 接口 地 址 不 同 ， 就 将 转发 他 地 址 设 为 网 关 的 卫 地址。 
路 由 决定 过 程 的 最 终结 果 是 从 路 由 表 中 选 定 一 条 路 由 。 路 由 选择 产生 一 个 转发 IP 地 址 
(网 关 IP 地 址 或 P 数据 报 的 目的 IP 地 址 ) 和 一 个 接口 (通过 接口 IP 地 址 标识 ) 。 如 果 路 
由 决定 过 程 未 能 找到 路 由 ，IP 模块 就 宣告 一 个 路 由 选择 错误 。 对 于 发 送 主机 ， 路 由 选择 错误 
在 内 部 被 提交 给 TCP 或 UDP 等 上 层 协 议 。 对 于 路 由 器 , 该 IP 数据 报 被 丢弃 并 向 源 主机 发 送 
一 个 ICMP“ 目 的 地 不 可 达 一 主机 不 可 达 ” 消 息 。 
Windows 提出 了 默认 网 关 度 量 的 新 配置 选项 。 该 度量 提供 对 任意 时 刻 活动 默认 网 关 进行 
更 好 的 控制 。 该 度量 默认 值 为 1， 低 度量 路 由 比 高 度量 路 由 好 。 在 默认 网 关 情 况 下 ， 计 算 机 
使 用 度量 最 小 的 默认 网 关 ， 除 非 该 网 关 是 不 活动 的 ， 在 这 种 情况 下 ， 死 站 网 关 探 测 器 把 开关 
值 切换 到 列表 中 下 一 个 具有 最 小 度量 的 默认 网 关 。 默 认 网 关 度 量 可 以 通过 TCP/IP 高 级 配置 
选项 进行 设置 。DHCP 服务 器 能 提供 一 个 基本 度量 和 一 组 默认 网 关 。 如 果 DHCP 服务 器 提供 
的 基本 度量 为 100， 并 提供 3 个 默认 网 关 ， 那 么 这 三 个 网 关 的 度量 分 别 为 100、101 和 102。 
DHCP 提供 的 基本 度量 不 适用 于 静态 配置 的 默认 网 关 。 

大 多 数 自治 系统 (AS) 路 由 器 用 路 由 选择 信息 协议 (RIP) 或 开放 最 短路 径 优 先 (OSPF) 
同 其 他 路 由 器 交换 路 由 表 信 息 。Windows 以 路 由 选择 和 远程 访问 服务 支持 这 些 协议 ,Windows 
也 支持 沉默 的 RIP， 方 法 是 使 用 RIP 进行 侦 听 ， 该 功能 是 可 选 的 网 络 服务 。 默 认 情况 下 ， 基 
于 Windows 的 系统 并 不 像 路 由 器 那样 工作 ， 也 不 在 接口 间 转 发 PP 数据 报 。 路 由 选择 和 远程 
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访问 服务 包含 在 Windows 中 ， 可 以 启用 并 通过 配置 提供 完全 的 多 协议 路 由 选择 ARS. 
16.1.2.3 £4 IP 地 址 检测 


重复 他 地址 检测 保证 一 个 他 结 点 所 使 用 的 他 地 址 在 其 所 连接 的 网 段 上 是 惟一 的 。 当 协 
议 栈 第 一 次 初始 化 时 ，Windows 对 主机 自身 IP 地 址 发 送 ARP 请 求 包 解析 自己 的 卫 地址 , 称 
之 为 伴随 ARP. 如 果 任何 其 他 主机 响应 了 这 样 的 ARP 请 求 , 该 他 地 址 就 已 经 被 占用 了 。 ARP 
高 速 缓 存 项 在 收 到 ARP 请 求 后 就 会 更 新 。 因而 , 在 向 占用 地 址 系统 发 送 了 单 播 ARP 应 答 后 ， 
被 占用 地 址 系统 会 广播 一 个 附加 的 伴随 ARP 请 求 ， 以 便 网 络 中 其 他 主机 能 在 它们 的 ARP 高 
速 缓存 中 维持 正确 的 地 址 映射 , 当 计算 机 不 与 网 络 相 连 时 ,用 户 可 以 用 重复 的 了 P 地 址 启动 它 ， 
在 这 种 情况 下 ， 不 会 检测 到 冲突 。 但 是 ， 如 果 用 户 随后 把 它 加 入 到 网 络 中 ， 当 它 第 一 次 对 其 
Ab IP 地址 发 送 ARP 请 求 时 ， 任 何 使 用 该 冲突 地 址 的 Windows 计算 机 将 检测 到 冲突 并 保持 运 
行 。 如 果 两 台 计 算 机 都 运行 Windows, P 在 两 台 有 重复 地 址 的 计算 机 上 都 保持 运行 。 检 测 到 冲 
突 的 计算 机 将 显示 一 条 出 错 消息 并 在 系统 日 志 中 产生 详细 的 日 志 。Windows DHCP 允许 客户 机 
执行 重复 他 地 址 检测 ， 条 件 是 客户 机 进入 DHCP 选择 状态 。 如 果 检 测 到 重复 IP 地 址 ，DHCP 
客户 机 就 向 DHCP 服务 器 发 送 一 个 DHCP 拒绝 数据 包 ， 然 后 进入 DHCP 初始 化 状态 。 在 收 到 
DHCP 拒绝 数据 包 后 ，DHCP 服务 器 就 将 该 卫 地 址 置 为 不 可 用 。 


16.1.3 ”传输 层 


16:1.3:1, TCP 


传输 控制 协议 CTCP) 为 应 用 程序 提供 基于 连接 的 、 可 靠 的 字 节 流 服务 。Windows 网 络 
依靠 TCP 来 实现 登录 过 程 、 文 件 和 打印 共享 、 域 控制 器 之 间 的 信息 复制 、 浏 览 列表 传输 和 其 
他 常用 功能 。 它 也 能 用 于 一 对 一 的 通信 。TCP 使 用 检验 和 来 检查 TCP 报头 和 TCP 段 中 有 效 
载荷 的 传输 错误 ， 以 减少 网 络 出 错 而 未 被 检测 到 的 概率 。 

TCP 接收 窗口 大 小 的 计算 和 窗口 缩放 。TCP 接收 窗口 大 小 是 指 每 次 在 一 个 连接 上 能 缓存 
的 接收 数据 量 〈 以 字 节 计 ) 。 在 接收 主机 等 待 应 答 数据 并 更 新 窗口 之 前 ， 发 送 主机 只 能 发 送 
这 么 多 数据 。Windows TCP/IP 设计 成 能 在 大 多 数 情况 下 进行 自我 调节 ， 从 而 能 比 以 前 版 本 使 
用 更 大 的 默认 窗口 。TCP 的 窗口 大 小 能 适应 连接 建立 期 间 所 协商 的 最 大 段 长 (MSS) 的 平 组 
增加 ， 而 不 是 采用 硬 编码 的 默认 窗口 大 小 。 使 接收 窗口 能 适应 Mss 的 平缓 增加 提高 了 大 批 
数据 传输 过 程 中 使 用 的 满载 TCP 段 的 比例 。 默 认 情 况 下 接收 窗口 大 小 按 如 下 方式 计算 。 

(1) 发 往 远程 主机 的 第 一 个 连接 请 求 通告 一 个 接收 窗口 大 小 ， 一 般 为 16 千 字 节 
(KB) ， 即 16 384 字 节 。 

(2) 一 旦 建立 了 连接 ， 接 收 窗口 大 小 就 舍 入 成 连接 建立 期 间 所 协商 的 TCP 最 大 段 长 
(MSS) 的 整数 倍 。 

G) 如 果 舍 入 值 不 到 MSS 的 4 倍 ， 就 把 它 调整 到 4xMSS， 同 时 最 大 值 限制 为 64KB， 
除非 窗口 缩放 选项 被 启用 。 

(4) 基于 以 太 网 的 TCP 连接 ， 其 窗口 大 小 正常 时 为 17 520 字 节 ， 或 舍 入 到 16KB CHI 
12 个 1460 字 节 的 字段 ) 。 

为 了 提高 高 带宽 、 高 延迟 网 络 的 性 能 ，Windows TCP 支持 RFC1323 中 定义 的 TCP 窗口 
缩放 。 通 过 在 TCP 三 次 握手 期 间 商 定 一 个 窗口 缩放 因子 ， 支 持 TCP 接收 窗口 的 大 小 可 大 于 
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64KB。 它 支持 的 接收 窗口 最 大 可 达 1GB。 在 阅读 支持 可 变 窗口 主机 之 间 所 建立 的 连接 的 有 
关 信 息 时 ， 必 须 记 住 段 中 通告 的 窗口 大 小 要 乘 以 商定 的 缩放 因子 。 窗 口 缩放 因子 只 在 三 次 握 
手 的 前 两 个 段 中 出 现 。 缩 放 因子 是 23， 其 中 s 为 商定 缩放 因子 。 例 如 ， 对 缩放 因子 为 3 的 通 
告 窗口 大 小 65 535， 实 际 接收 窗口 大 小 为 524 280 即 23x65 535. 

TCP 采用 延迟 应 答 来 减少 传输 介质 中 的 包 数 。Windows TCP 采用 变通 的 方法 实现 延迟 
ACK， 并 不 对 每 个 接收 到 的 TCP 段 发 送 应 答 。TCP 在 给 定 连 接 上 收 到 数据 ， 只 有 当 以 下 条 
件 符合 时 才 回 送 应 答 。 

O 没有 为 以 前 接收 到 的 段 发送 过 ACK。 

口 ” 接 收 到 一 个 段 ， 但 在 该 连接 上 200ms 之 内 没有 接收 到 其 他 段 。 

口 ” 通 常 为 连接 上 接收 到 的 每 个 其 他 TCP 段 都 发 送 ACK, 直到 延迟 ACK 定时 器 (200ms) 

超时 。 

Windows 开始 支持 一 项 称 为 选择 性 应 答 (SACK) 的 重要 性 能 特性 。SACK 对 使 用 较 大 
TCP 窗口 的 连接 很 重要 。 在 SACK 之 前 ,接收 者 只 能 应 答 连 接 上 接收 到 的 最 后 一 个 数据 , 或 
接收 窗口 的 左边 界 。 当 SACK 启用 时 ， 接 收 者 连续 地 使 用 ACK 编号 来 应 答 接收 窗口 的 左边 
界 , 但 接收 者 也 能 对 不 连续 的 接收 数据 块 单独 进行 应 答 。SACK 在 TCP 连接 建立 期 间 用 TCP 
报头 选项 来 协商 SACK 的 使 用 ， 并 标明 接收 数据 块 的 左右 边界 。 可 以 指示 多 个 接收 块 。 默认 
情况 下 ，SACK 是 启用 的 。 当 一 个 段 或 一 系列 段 以 非 连续 模式 到 达 时 ， 接 收 者 能 准确 地 通知 
发 送 者 哪个 数据 已 收 到 ， 也 隐 含 表明 哪个 数据 没 到 达 。 发 送 者 能 够 有 选择 地 重 发 所 缺 数据 ， 
而 不 必 重 发 已 成 功 接收 的 整个 数据 块 。 

TCP 重 发 行为 。 当 每 个 出 站 段 传递 给 IP 时 ，TCP 都 启动 一 个 重 发 定时 器 。 如 果 在 定时 
器 超时 前 没收 到 给 定 段 中 数据 的 应 答 ， 就 重 发 该 段 。 对 于 新 的 连接 请 求 ， 重 发 定时 器 初始 化 
为 3 秒 。 重 发 超时 (RTO) 在 外 出 段 的 基础 上 进行 调整 ， 以 匹配 使 用 平滑 往返 时 间 (SRTT) 
计算 的 连接 特性 和 Kam 算法 。 给 定 段 的 定时 器 值 在 每 次 重 发 该 段 后 就 加 倍 。 采 用 这 种 算法 ， 
TCP 自己 就 能 适应 连接 的 “正常 ”延迟 ,高 延迟 链 路 上 的 TCP 连接 比 低 延 迟 链 路 上 的 要 经 历 
更 长 的 时 间 才 超时 。 

在 某 些 情况 下 无 须 重 发 定时 器 超时 就 需 进行 重 发 。 最 常见 的 一 种 情况 称 为 快速 重 发 。 如 
果 支 持 快 速 重 发 的 接收 者 接收 到 的 数据 中 所 包含 的 序列 号 超过 期 望 值 ， 某 些 数 据 很 可 能 丢失 
了 。 为 帮助 发 送 者 意识 到 这 件 事 ， 接 收 者 立即 发 送 ACK， 其 应 答 序号 设 为 所 期 望 的 序列 号 。 
对 到 来 数据 流 中 每 个 在 丢失 数据 之 后 的 段 ， 接 收 者 同样 处 理 。 当 发 送 者 开始 接收 到 一 系列 应 
答 同 一 序列 号 的 ACK， 并 且 该 序列 号 比 当前 发 送 的 序列 号 小 时 ， 它 就 能 推断 出 某 一 〈 某 些 ) 
段 已 丢失 了 。 支 持 快速 重 发 算法 的 发 送 者 立即 发 送 接收 者 所 期 望 的 段 ， 接 收 者 将 用 这 些 段 来 
填充 接收 数据 中 的 缺口 ， 而 不 必 等 到 该 段 重 发 定时 器 超时 。 这 种 优化 在 高 丢失 率 网 络 环境 中 
极 大 地 提高 了 性 能 。 

TCP 保持 活动 消息 。TCP 保持 活动 包 只 是 一 个 简单 的 ACK， 其 序列 号 比 本 连接 的 当前 
序列 号 小 1。 主机 接收 到 这 种 ACK 后 ,就 以 当前 序列 号 应 答 。 保持 活动 可 用 来 证 实 本 连接 的 
远程 计算 机 仍 是 可 用 的 。TCP 保持 活动 包 每 个 时 间 段 内 发 送 一 次 ， 时 间 段 的 长 短 由 
KeepAliveTime 的 值 ( 默 认为 7200 000ms， 即 2h) 决定 ,前提 是 没有 其 他 数据 或 更 高 级 别 的 
保持 活动 包 在 本 连接 中 传输 。 如 果 保 持 活动 包 没 被 应 答 ， 就 在 每 个 时 间 段 重 发 一 次 ， 时 间 段 
的 长 度 是 与 KeepAliveInterval 的 值 相等 的 秒 数 。 默 认 时 KeepAliveInterval 的 值 为 1s。 在 NetBT 
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连接 中 ， 正 如 许多 Windows 联网 组 件 所 使 用 的 那样 ， 以 更 高 的 频率 发 送 NetBIOS 保持 活动 
数据 包 。 因 此 ， 在 NetBIOS 连接 上 就 不 再 发 送 正常 的 TCP 保持 活动 包 。TCP 保持 活动 功能 
默认 时 是 关闭 的 。 

慢 启 动 算法 和 拥塞 避免 。Windows TCP 支持 慢 启 动 和 拥塞 避免 算法 。 一 个 连接 建立 后 ， 
TCP 起 先 只 缓慢 地 发 送 数 据 来 估计 连接 的 带宽 ， 以 避免 淹没 接收 主机 或 通路 上 的 其 他 设备 和 
链 路 。 发 送 窗 口 大 小 设 为 2 个 TCP 段 ， 当 两 个 段 都 被 应 答 后 ， 窗 口 大 小 就 扩大 为 三 个 段 。 当 
三 个 段 都 被 应 答 后 ， 发 送 窗口 大 小 再 次 扩大 。 如 此 进行 ， 直 到 每 次 突 发 传输 的 数据 量 达 到 远 
程 主机 所 声明 的 接收 窗口 大 小 。 此 时 ， 慢 启动 算法 就 不 再 用 了 ， 改 用 声明 的 接收 窗口 进行 流 
控制 。 在 传输 中 的 任何 时 刻 都 可 能 发 生 拥 塞 。 当 重 发 定时 器 超时 ， 或 接收 到 说 明 已 经 有 TCP 
段 被 路 由 器 丢弃 的 ICMP“ 源 中 止 ” 消 息 时 ， 就 可 检测 到 拥塞 。 发 生 这 种 情况 时 ，TCP 拥塞 
避免 算法 就 减 小 发 送 窗口 的 大 小 ， 并 使 其 逐步 减 小 到 拥塞 发 生 时 的 窗口 大 小 的 一 半 ， 然 后 ， 
使 用 慢 启 动 算法 来 增 大 发 送 窗 口 ， 使 其 达到 接收 主机 接收 窗口 的 大 小 。 

糊涂 窗口 综合 症 。 糊 涂 窗口 综合 症 CSWS) 指 声明 的 接收 窗口 小 于 一 个 完整 的 TCP Be. 
糊涂 窗口 综合 症 会 导致 发 送 很 小 的 TCP 段 ， 致 使 网 络 使 用 效率 非常 低 。Windows TCP/IP 3c 
现 了 RFC1122 中 描述 的 发 送 者 和 接收 者 SWS 避免 。 接 收 端 SWS 避免 的 实现 是 : 在 增加 的 
数据 小 于 一 个 TCP 段 之 前 不 打开 接收 窗口 。 发 送 端 SWS 避免 的 实现 是 ， 在 接收 端 声明 发 送 
完整 TCP 段 的 有 效 窗口 大 小 之 前 不 发 送 更 多 数据 。 发 送 端 SWS 避免 有 例外 情况 ， 参 见 
RFC1122. 

TCP TIME-OUT 延 时 。TCP 连接 关闭 后 ， 该 连接 就 进入 一 种 称 为 TIME-OUT 的 状态 ， 
以 确保 新 连接 不 会 使 用 相同 的 协议 、 源 IP 地 址 、 目 的 IP 地 址 、 源 端口 和 目的 端口 ， 直 到 经 
过 了 足够 长 的 时 间 ， 能 确定 不 会 有 任何 被 错误 路 由 或 延迟 的 段 突然 出 现 。 套 接 字 对 不 应 当 被 
再 次 使 用 的 时 间 长 度 由 RFC793 定义 , 一 般 为 最 大 生命 周期 的 两 倍 (2MSL) 或 240s (4min) ， 
这 是 Windows 的 默认 值 , 但 是 , 在 使 用 默认 值 时 ， 某 些 在 短 时 间 内 执行 大 量 出 站 连接 的 应 用 
程序 可 能 在 端口 能 被 重用 之 前 耗 尽 所 有 的 可 用 端口 。Windows 对 这 种 情况 提供 两 种 控制 方 
法 。 

第 一 种 : 用 注册 表 表 项 TcpTimedWaitDelay (HKLM\SYSTEM\CurrentControlSet\Services 
\Tcpip\Parameters) 来 改变 这 个 时 间 值 。Windows 允许 将 该 值 设 成 只 有 30s， 这 在 大 多 数 情况 
下 就 不 会 有 问题 了 。 

第 二 种 : 通过 注册 表 表 项 MaxUserPort ( HKLM\SYSTEM\CurrentControlSet\Services\ 
Tcpip\Parameters) 来 配置 源 出 连接 的 用 户 可 访问 的 临时 端口 数 。 默 认 情 况 下 ， 当 应 用 程序 为 
出 站 调用 申请 任何 套 接 字 时 ， 将 采用 端口 号 在 1024 一 5000 的 端口 。 用 户 可 通过 注册 表 表 项 
MaxUserPort 设置 出 站 连接 可 使 用 的 最 高 端口 号 。 例 如 , 将 值 设 为 10 000 将 有 大 约 9000 个 可 
供出 站 连接 使 用 的 用 户 端口 。 

吞吐 量 因 素 。Windows TCP/IP 在 大 多 数 网 络 条 件 下 都 适用 , 它 能 为 每 个 连接 动态 地 提供 
可 能 的 最 大 吞吐 量 和 最 佳 可 靠 性 。TCP 设计 成 能 在 不 同 的 链 路 条 件 下 提供 最 优 性 能 。 一 个 链 
路 上 的 实际 吞吐 量 与 很 多 因素 有 关 , 最 主要 的 有 以 下 几 个 : 链 路 速度 (每 秒 可 传输 的 比特 数 )、 
传播 延迟 、 窗 口 大 小 〈TCP 连接 上 可 发 送 的 未 响应 数据 量 ) 、 链 路 可 靠 性 、 网 络 和 中 间 设 备 
拥塞 。 

吞吐 量 的 关键 因素 包括 : 
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通信 信道 〈 又 称 管道 ) 的 容量 ， 即 带宽 延迟 量 ， 是 往返 时 间 乘 以 带宽 RR) 。 如 果 
某 一 链 路 的 比特 级 错误 很 少 ， 最 佳 性 能 时 的 窗口 大 小 应 大 于 或 等 于 带宽 延迟 量 ， 以 使 发 送 者 
能 充满 管道 。 不 启用 窗口 缩放 时 ， 可 用 的 最 大 窗口 为 65 535， 因 为 窗口 域 在 TCP 报头 中 只 占 
16 位 。 启 用 窗口 缩放 时 ， 窗 口 大 小 可 达 1GB。 

吞吐 量 决 不 能 超过 窗口 大 小 除 以 往返 时 间 。 

如 果 链 路 有 很 多 比特 级 错误 或 经 常 严重 拥塞 以 致 于 要 丢弃 包 ，, 使 用 更 大 的 窗口 就 不 能 提 
高 性 能 。Windows 支持 SACK， 以 改善 高 丢失 率 环境 下 的 性 能 ， 也 支持 TCP 时 标 ， 以 改善 
RTT 估计 。 

传播 延迟 取决 于 向 不 同 传输 方向 传送 光 或 电信 号 的 延迟 以 及 传输 设备 和 中 间 系 统 的 

传输 延迟 取决 于 传输 介质 的 速度 和 介质 访问 控制 模式 的 本 质 属性 。 

对 特定 路 径 ， 传 播 延迟 是 固定 的 ， 但 传输 延迟 取决 于 包 大 小 和 拥塞 情况 。 

低速 时 ， 传 输 延迟 是 限制 因素 ; 高 速 时 ， 传 播 延迟 就 可 能 成 为 限制 因素 。 
16.1.3.2 UDP 


用 户 数据 报 协议 (UDP) 提供 无 连接 、 不 可 靠 的 传输 服务 。 它 通常 用 于 使 用 广播 或 多 播 
IP 数据 报 的 一 到 多 通信 。 由 于 UDP 数据 报 的 传送 是 得 不 到 保证 的 ， 所 以 使 用 UDP 的 应 用 程 
序 必 须 通过 简单 的 重 发 或 其 他 可 靠 性 机 制 来 补偿 丢失 的 UDP 数据 报 。Windows 网 络 使 用 UDP 
进行 登录 、 浏 览 和 NetBIOS 名 字 解 析 。 

UDP 可 用 于 NetBIOS 名 字 解 析 ， 方 法 是 通过 NetBIOS 名 字 服 务 器 单 播 或 子 网 广播 ， 也 
可 用 于 将 域名 系统 (DNS) 主机 名 解析 成 卫 地 址 。NetBIOS 名 字 解 析 由 UDP 端口 137 完成 ， 
DNS 查询 使 用 UDP 端口 33。 由 于 UDP 本 身 不 保证 数据 报 的 传送 ， 这 两 种 服务 在 收 不 到 查 
询 回答 时 ， 就 使 用 自己 的 重 发 机 制 。UDP 广播 数据 报 一 般 不 用 IP 路 由 器 转发 ， 因 此 路 由 环 
境 下 的 NetBIOS 名 字 解 析 需 要 WindowsInternet 名 字 服 务 (WINS) 之 类 的 名 字 服 务 器 ， 或 者 
使 用 静态 数据 库 文件 ， 如 Lmhost 文件 。 


16.1.4 TCP/IP 开发 接口 


Windows 网 络 应 用 程序 可 采用 多 种 方法 通过 TCP/IP 协议 栈 进 行 通信 。 有 些 方法 如 命名 
管道 等 要 通过 网 络 重 定 向 器 ， 它 是 工作 站 服务 的 一 部 分 。 许 多 老 的 应 用 程序 是 根据 NetBIOS 
接口 编写 的 ， 由 TCP/IP 上 的 NetBIOS 支持 。 但 这 里 只 简单 说 明 Windows 套 接 字 接 口 。 

Windows 套 接 字 定义 了 一 个 编程 接口 ， 该 接口 基于 加 利 福 尼 亚 大 学 伯克利 分 校 的 套 接 字 
接口 。 它 还 包括 一 组 扩展 设计 以 充分 利用 Windows 的 消息 驱动 特性 。 该 规范 的 1.1 版 本 于 1993 
年 1 月 发 布 ,2.2.0 版 本 于 1996 年 5 月 发 布 , Windows 2000 支持 版 本 2.2, 通常 又 称 Winsock2。 

有 很 多 可 用 的 Windows 套 接 字 应 用 程序 。Windows 中 就 包含 大 量 的 基于 Windows 套 接 
字 的 应 用 程序 ， 如 Ping 和 Tracert 工具 、FTP 和 DHCP 客户 机 及 服务 器 ， 以 及 Telnet 客户 。 
也 有 很 多 基于 Winsock 的 高 级 编程 接口 。 

名 字 和 地 址 解析 。Windows 套 接 字 应 用 程序 一 般 使 用 gethostbyname 函数 把 主机 名 解析 
成 卫 地址。 默认 情况 下 ，gethostbyname 函数 采用 以 下 的 名 字 查 找 步 又 。 

CD 检查 请 求 的 名 字 是 否 与 本 主机 名 匹配 。 
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(2) 检查 主机 文件 ， 看 是 否 有 匹配 的 名 字 。 
(3) 如 果 配 置 了 DNS 服务 器 ， 就 查询 它 。 
(4) 如 果 没 找到 匹配 项 ， 进 行 NetBIOS 名 字 解 析 过 程 ， 直 至 进行 DNS 名 字 解 析 。 
某 些 应 用 程序 使 用 gethostbyaddr 函数 把 IP 地 址 解析 成 主机 名 。gethostbyaddr 调用 执行 
以 下 动作 CRUD 时 : 
COD 检查 主机 文件 ， 以 寻找 匹配 地 址 项 。 
(2) 如 果 配 置 有 DNS 服务 器 ， 就 询问 它 。 
(3) 向 被 查询 的 IP 地 址 发 送 一 个 NetBIOS 适配器 状态 请 求 ， 如 果 它 已 注册 给 该 适 配 
器 的 一 组 NetBIOS 名 字 进 行 应 答 ， 就 从 中 分 析 计 算 机 名 字 。 
Winsock2 支持 人 P 多 播 。 但 目前 只 有 IP 族 数 据 报 和 原始 套 接 字 支 持 卫 多 播 。 
保留 值 参数 。Windows 套 接 字 服 务 器 应 用 程序 通常 创建 一 个 套 接 字 ， 然 后 在 该 套 接 字 上 
用 listen 函数 接收 连接 请 求 。 传递 给 listen 函数 的 参数 之 一 是 保留 值 参数 ,说 明 应 用 程序 希望 
Windows 套 接 字 为 本 套 接 字 排 队 的 连接 请 求 数 。 


16.2 UNIX/Linux 的 TCP/IP 实现 


Linux 是 开放 源码 的 操作 系统 ， 它 具有 强大 的 网 络 功能 。Linux 的 网 络 实现 是 以 4.3BSD 
为 模型 的 ， 它 支持 BSD Sockets( 及 一些 扩 展 ) 和 所 有 的 TCP/IP 网 络 。 选 这 个 编程 接口 是 因 
为 它 很 流行 并 且 有 助 于 应 用 程序 从 Linux 平台 移植 到 其 Unix 平台 。 因 此 可 以 看 出 ,虽然 UNIX 
操作 系统 和 Linux 操作 系统 存在 着 一 定 的 区 别 ， 但 它们 的 系统 结构 和 大 多 的 实现 技术 都 是 相 
同 的 。 在 TCP/IP 协议 的 实现 上 ,两 者 也 大 致 相同 ,所 以 本 节 主 要 以 Linux 操作 系统 中 的 TCUIP 
协议 的 实现 为 基础 说 明 UNIX/Linux 操作 系统 中 的 TCP/IP 协议 的 实现 机 制 。 

在 UNIX il Linux 系统 中 ， 协 议 栈 的 实现 通常 都 采用 BSD 或 STREAMS 两 种 结构 之 一 。 
从 概念 上 看 , STREAMS 结构 是 一 种 模块 化 的 系统 结构 , 具有 很 好 的 灵活 性 和 扩展 性 , 而 BSD 
结构 是 一 种 分 层 结构 。 图 16.2 说 明了 两 种 结构 的 区 别 。 

从 图 16.2 可 以 看 出 ，BSD 结构 比较 简单 ， 但 扩展 性 不 如 STREAMS 结构 。STREAMS 
结构 可 以 在 同一 个 系统 中 同时 实现 多 种 传输 协议 而 提供 统一 的 结构 和 对 上 层 的 接口 。 


16.2.1 Linux 网 络 协议 栈 


Linux 中 ， 协 议 栈 是 作为 内 核 的 一 部 分 实现 的 ， 因 此 它 包 含 在 内 核 代码 中 ， 如 图 163 
所 示 。 
从 图 16.3 可 以 看 出 ，Linux 的 协议 栈 可 以 支持 多 种 协议 。 在 物理 链 路 层 ， 除 了 支持 以 太 
网 外 ， 还 可 以 支持 帧 中 继 、FDDI 等 。 而 在 传输 层 除了 TCP/IP 协议 族 中 的 UDP 和 TCP， 还 
可 以 支持 AppleTalk, IPX 等 传输 层 协议 尽管 Linux 对 多 协议 的 支持 , 本 书 中 只 讨论 与 TCP/IP 
协议 相关 的 部 分 。 
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TPI: Transport Provider Interface 
DLPI: Data Link Provider Interface 


图 16.2 BSD 协议 栈 结构 和 STREAMS 协议 栈 结构 
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图 16.3 Linux 协议 栈 结构 


16.2.2 Linux 网 络 数据 处 理 流 程 
基于 上 述 的 Linux 中 严格 的 分 层 实 现 体系 ,在 Linux 系统 中 ， 一 个 应 用 程序 发 送 /接收 数 
据 的 流程 如 图 16.4 所 示 。 
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应 用 程序 产生 数据 应 用 程序 接收 数据 应 用 层 
ry 
y 
将 数据 包 交 给 socket 层 将 数据 包 交 给 socket 层 socket] 
LY 
Y 
将 数据 包 交 给 传输 层 将 数据 包 交 给 传输 层 传输 层 
i f 
将 数据 包 交 给 网 络 层 A 


将 数据 包 转发 到 哪 ? EARR EF 网 络 层 

转发 给 远程 

在 路 由 表 中 查找 下 一 跳 地 址 将 数据 包 交 给 网 络 层 
H 

Y 
将 数据 交 给 物理 链 路 层 发 往 本 地 的 ? —— sae ER — 

Y 

传输 数据 接收 到 数据 
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使 用 分 层 结构 实现 协议 栈 即 符合 TCP/IP 协议 的 分 层 思想 ， 又 利于 协议 栈 的 灵活 性 和 可 
扩展 性 ， 又 使 得 协议 数据 可 以 按 分 层 进行 处 理 。 图 16.4 中 ， 数 据 的 发 送 是 按 应 用 层 、socket 
层 、 传 输 层 、 网 络 层 、 数 据 链 路 层 从 上 到 下 的 顺序 进行 分 层 处 理 的， 而 接收 到 的 数据 则 正好 
是 按照 相反 的 顺序 从 下 向 上 进行 处 理 的 。 

应 用 程序 产生 数据 后 ， 就 将 其 通过 socket 提交 给 传输 层 CTCP 或 UDP) ， 传 输 层 将 其 交 
给 网 络 层 处 理 。 在 网 络 层 ，Linux 内 核 会 在 路 由 缓存 或 转发 信息 库 中 查找 路 由 信息 。 如 果 数 
据 包 是 发 给 其 他 计算 机 的 ， 内 核 就 会 将 其 交 给 链 路 层 输 出 到 网 络 接口 ， 并 最 终 发 送 到 物理 传 
输 介 质 上 。 

当 一 个 数据 包 从 物理 介质 到 达 输入 接口 时 ， 它 会 检查 该 数据 包 是 否 确实 是 发 往 该 计算 机 
的 。 如 果 是 ， 它 就 将 其 交 给 IP E. IP 层 查 找 路 由 表 。 如 果 该 数据 包 是 发 往 其 他 计算 机 的 ,人 P 
层 就 将 它 向 下 交 给 输出 接口 。 如 果 该 数据 包 是 发 往 本 地 计算 机 的 上 层 应 用 程序 的 ， 它 就 将 其 
通过 传输 层 和 socket 层 交 给 应 用 程序 进行 处 理 。 
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16.2.3 Linux 的 IP 路 由 


从 图 16.4 可 以 看 出 , IP 层 在 数据 的 发 送 和 接收 过 程 中 起 着 关键 的 作用 , 它 能 够 判断 一 个 
数据 包 应 该 通过 那 条 路 径 到 达 它 的 目的 地 。 因 为 Linux 系统 可 以 是 一 个 主机 系统 或 者 是 一 个 
路 由 器 ， 所 以 IP 层 的 路 由 表 的 具体 实现 和 查找 机 制 在 数据 发 送 和 接收 过 程 中 显得 非常 ” 重 
要 。 

当 Linux 的 内 核 装载 时 ， 它 会 读 取 一 系列 的 配置 文件 并 执行 一 系列 的 任务 ， 其 中 就 包括 
建立 计算 机 的 网 络 连接 的 过 程 。 该 过 程 会 配置 好 计算 机 的 地 址 ， 初 始 化 网 络 接口 ， 建 立 好 路 
由 表 并 向 其 中 添加 静态 路 由 。 

整个 的 配置 过 程 可 以 是 动态 的 ， 也 可 以 是 静态 的 。 配 置地 址 的 方式 可 以 有 两 种 ， 如 果 计 
算 机 有 一 个 固定 的 地 址 ， 系 统管 理 员 可 以 在 配置 文件 中 指定 。 那 么 系统 启动 时 ， 计 算 机 的 地 
址 就 是 该 地 址 了 。 如 果 计算 机 没有 固定 的 地 址 ， 主 机 可 以 使 用 DHCP 协议 来 从 DHCP 服务 器 
获得 计算 机 的 地 址 ， 路 由 器 和 DNS 服务 器 等 信息 。 

Linux 中 使 用 两 种 复杂 的 路 由 表 来 维护 转发 信息 : 转发 信息 表 (FB) 用 来 保存 所 有 可 能 
的 转发 地 址 ， 路 由 缓存 比 FIB 小 但 查找 速度 快 ， 是 经 常 使 用 的 路 由 表 。 一 个 IP 数据 包 需 要 
发 送 到 远程 主机 时 ， 卫 层 首先 在 路 由 缓存 中 查找 合适 的 项 。 如 果 找 到 ，IP 就 使 用 它 进行 数据 
包 的 转发 。 如 果 没 找到 ，IP 就 从 FB 中 进行 查找 ， 并 将 找到 的 表 项 添加 到 路 由 缓存 中 ， 然 后 
使 用 该 表 项 进行 数据 包 的 转发 。 

根据 网 络 状态 的 变化 ， 路 由 表 需 要 进行 相应 的 改变 。Linux 中 路 由 缓存 会 经 常 变化 ， 但 
FIB 几乎 是 静态 的 ， 只 有 在 网 络 状态 发 生变 化 时 才 会 发 生 改变 。 
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从 本 章 开始 ， 我 们 介绍 如 何 使 用 套 接口 API 开发 网 络 应 用 程序 。 大 部 分 网 络 应 用 系统 都 
可 以 分 为 客户 端 (Client) 和 服务 器 端 (Server) ， 也 就 是 通常 所 说 的 C/S 结构 。 两 者 相 比较 ， 
客户 端 开发 需要 解决 的 是 用 户 界 面 的 友好 性 ， 服 务 器 开发 则 需要 解决 设计 上 的 健壮 性 和 扩展 
性 。 友 好 的 界面 固然 重要 ， 但 并 不 是 网 络 应 用 考虑 的 重点 ， 我 们 的 最 终 目 标 是 让 读者 能 够 开 
发 一 个 Windows 平台 下 的 具有 相当 扩展 性 和 健壮 性 的 实用 服务 器 程序 。 需 要 说 明 的 是 ,本 书 
并 不 是 Winsock 的 用 户 编程 指南 ， 它 只 涉及 到 我 们 认为 读者 必须 掌握 的 那些 API 函数 。 虽 然 
讨论 的 是 Windows 平台 中 的 网 络 编程 ， 但 其 中 的 很 多 技术 及 思想 可 以 用 于 其 他 操作 系 ” 统 
中 。 

我 们 的 测试 环境 是 Windows 2000 Server (SP4) 系统 ，VC6.0+SP5+Platform Core 
SDK2003。 书 中 的 所 有 源码 均 在 该 环境 下 编写 并 测试 通过 。 
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在 互联 网 协议 中 两 种 常用 的 应 用 编程 接口 是 套 接 口 〈Sockets) 和 运输 层 接口 CTLD 。 
因为 第 一 个 被 广泛 使 用 的 TCP/IP 协议 栈 和 套 接 口 API 版 本 是 在 4.2BSD 系统 (1983 年 ) 中 
发 布 的 ， 前 者 也 常 被 称 为 伯克利 套 接口 (Berkeley Sockets) 。 目 前 它 已 被 广泛 地 移植 到 很 多 
非 BSD UNIX 系统 和 非 UNIX 系统 中 ， 其 中 就 包括 Windows。 后 者 最 初 由 AT&T 开发 ， 由 
于 被 X/Open〔 即 现在 的 Open Group) 承认 ， 有 时 也 叫做 XTI (X/Open 传输 接口 ) 。X/Open 
开始 时 是 一 个 由 欧洲 、 美 国 和 亚洲 的 国际 UNIX 厂家 组 成 的 协会 , 现在 已 经 成 为 像 POSIX 和 
ANSI 一 样 的 标准 化 组 织 之 一 。 

本 书 主要 介绍 基于 套 接口 API 的 网 络 编程 ， 不 涉及 到 TLI， 对 后 者 感 兴趣 的 读者 可 以 参 
ba W. Richard Stevens 关于 网 络 编程 的 经 典 读物 《UNIX 网 络 编程 (第 一 卷 ) 一 一 套 接口 API 
和 X/Open 传输 接口 API》。 

Berkeley Sockets 接口 在 Windows 平台 上 的 移植 版 本 称 为 Winsock, 它 不 仅 包含 前 者 的 大 
部 分 函数 ， 还 包含 一 组 针对 Windows 系统 的 扩展 库 函 数 〈 通 常 以 字母 WSA 打头 ) ， 这 些 函 
数 使 编程 人 员 能 充分 利用 Windows 的 消息 机 制 以 及 Win32 平台 下 的 高 性 能 VO 模型 。 最 初 的 
伯克利 套 接口 API 在 Windows 平台 下 的 移植 版 本 是 Winsock1.1， 在 它 的 基础 上 ， 微 软 又 进 
一 步 提供 了 Winsock2 接口 。 在 Winsock 1.1 版 本 中 ， 不 同 的 TCP/IP 协议 栈 供应 商 需 要 提供 
自己 的 Winsock 接口 实现 的 动态 链接 库 ， 因 此 底层 协议 栈 与 Winsock 的 接口 在 不 同 实现 之 间 
是 完全 不 同 的 。 为 了 能 同时 提供 对 多 种 底层 网 络 传输 协议 访问 的 能 力 ，Winsock2 的 框架 结构 
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与 Winsock 1.1 版 本 相 比 做 了 很 大 的 改进 。 它 在 Winsock 接口 与 协议 栈 之 间 定 义 了 一 种 标准 
服务 提供 接口 (SPI) ， 这 就 使 得 同一 个 Winsock 动态 链接 库 能 同时 访问 多 个 由 不 同 供应 商 


供 了 单独 的 WS2_32.dll， 该 链接 库 已 经 成 为 Windows 系统 的 一 个 基本 组 件 。 


Cs) 提供 的 协议 栈 。 并且， 协议 栈 供 应 商 不 再 需要 提供 自己 的 Winsock 接口 实现 链接 库 ， 微 软 提 


Winsock2 框架 结构 如 图 17.1 所 示 ， 在 该 图 中 有 3 点 值得 注意 : 首先 ， 在 编写 Winsock 
应 用 程序 时 ， 一 般 并 不 直接 使 用 Ws2_32.dll, 而 是 用 其 对 应 的 静态 链接 库 Ws2_32.lib; 其 次 ， 
Winsock 内 核 模式 驱动 afd.sys 是 Winsock2 网 络 缓存 的 管理 器 ， 应 用 程序 是 从 afd.sys 的 内 部 
缓冲 区 复制 网 络 数据 ， 而 发 送 数据 事实 上 也 是 向 该 内 部 缓冲 区 复制 数据 〈 后 文 将 提 到 如 何 对 
该 缓冲 区 的 大 小 进行 控制 ) ;最 后 ，Winsock2 支持 多 种 底层 的 网 络 协议 ， 如 TCP/IP, ATM 


等 ， 本 书 只 涉及 到 TCP/IP 部 分 。 


Windows Sockets 1.1 AP] 一 


Windows Sockets 2.0 API 一 —————————————————————————————————————— 


Windows Sockets 2.0 SPI 一 Maa 


[~~ *  nuidmehwue ij. i. | Service Provider 


Helper Dils 
‘Wshtcpip dll Wshnetbs dll Wshirda dll 


Wshatm dll Wshisn dll Wshisotp.dll Sfmwshat dll. 


Mswsock.dll 
Ws2 32.dll 
Wshelp.dll 
Name Space Dlls 
Nwprovau dll Rnr20 dll Winmr dll 


TDI Layer 


17.1 Winsock2 框架 结构 


Windows Sockets Windows Sockets Windows Sockets 
16-bit 1.1 Application 32-bit 1.1 Application 32-bit 2.0 Application 


那么 ， 从 用 户 的 角度 来 看 ， 套 接口 究竟 是 什么 呢 ? 事实 上 ， 套 接口 是 网 络 通信 端点 的 一 
种 抽象 概念 ， 它 为 用 户 提供 了 一 种 发 送 和 接收 数据 的 机 制 。 如 果 需 要 在 分 布 于 不 同 主机 上 的 


进程 之 间 进 行 通信 ， 那 么 Sockets 是 一 种 理想 的 手段 ， 我 们 可 以 通过 它 来 交换 数据 。 


Sockets 是 一 种 进程 间 通 信 的 机 制 ， 适 用 于 分 布 式 环境 。 
从 下 一 节 开 始 ， 我 们 将 逐步 介绍 Winsock 编程 的 一 些 基本 概念 和 函数 。 


因此 ， 
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17.2 地址 与 地 址 操作 函数 


要 实现 通信 ， 就 必须 要 有 地 址 的 概念 。 在 Socket 编程 过 程 中 ， 经 常会 碰 到 3 种 类 型 的 套 
接口 地 址 结构 ， 分 别 是 INET 协议 族 地 址 结构 、IPv4 地 址 结构 和 通用 地 址 结构 。 
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INET 协议 族 地 址 结构 一 一 sockaddr_in 


地 址 结构 名 中 的 最 后 两 个 字母 “in”, 是 Internet 的 简写 , 说 明 该 结构 仅 适用 于 采用 TCP/IP 
协议 的 网 络 ， 结 构 定义 如 下 : 


/* Socket 地 址 ，internet 类 型 */ 
struct sockaddr in { 


Qaa 


short sin family; 
u short sin port; 
struct in addr sin addr; 
char sin zero[8]; 


sin family: 地 址 族 ， 一 般 填 为 AF INET。 在 网 络 编程 过 程 中 ， 有 可 能 会 碰 到 另 一 
组 和 AF XXX 类 似 的 PF_XXX 常量， 与 AF INET 相对 应 有 PF_INET。 历 史上 ， 
PF_XXX 被 设计 用 于 表示 协议 族 ， 而 AF_XXX 用 于 表示 地 址 族 。 最 初 的 设想 是 单 
个 协议 族 可 以 支持 多 个 地 址 族 , PF. XXX 用 于 套 接口 的 创建 ， AF_XXX 用 于 套 接口 
地 址 结构 。 但 事实 上 ,这 种 设计 思想 从 来 没有 成 为 现实 。 在 Winsock2.h 文件 中 可 以 
RIL, PF XXX HENKI AF XXX 值 完全 相同 。 因 此 ， 在 本 书 中 ， 统 一 使 用 
AF_XXX 常量 定义 。 

sin port: 16 位 的 他 端口， 必须 注意 字 节 序 问题 ， 见 17.4 节 。 

sin_addr: 32 位 的 IPv4 地 址 ， 见 17.2.2 节 。 

sin zero: 8 个 字 节 的 0 值 填充 ， 惟 一 的 作用 是 使 sockaddr in 结构 大 小 与 通用 地 址 
结构 sockaddr (JL 17.2.3 节 ) 相同 。 虽 然 很 少 有 函数 要 求 该 结构 域 必 须 为 零 ， 但 是 
在 给 结构 体 赋值 之 前 先 将 其 全 部 初始 化 为 零 是 一 个 好 习惯 。 下 面 的 两 个 函数 经 常 被 
用 来 完成 清 零 工作 ， 由 于 前 者 仅 适 用 于 Win32 平台 ， 推 荐 使 用 后 者 。 


VOID ZeroMemory (PVOID destination, SIZE T length); 
void *memset( void *dest, int c, size_t count ); 


17.2.2 


IPv4 地 址 结构 一 一 in_addr 


用 于 存储 32 位 IPv4 地 址 的 数据 结构 ， 其 定义 如 下 : 


/* Internet address (old style... should be updated) */ 
struct in_addr { 
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union { 
struct { u_char s bl,s b2,s b3,s b4; } S un b; 
struct { u short s wl,s w2; ) S un w; 
u long S addr; 


} 8 un; 
#define s addr S un.S addr /* can be used for most tcp & ip code */ 
#define s host S un.S un b.s b2 /* host on imp */ 
#define s net S un.S un b.s bl /* network */ 
#define s imp S un.S un w.s w2 /* imp */ 
#define s impno S un.S un b.s b4 /* imp # */ 


#define s lh S un.S un b.s b3 /* logical host */ 
E 


该 结构 提供 了 3 种 赋值 的 接口 S addr, S un b 和 S_un _w， 最 常用 的 是 前 两 种 。 
O S_addr: 32 位 的 无 符号 整数 ， 对 应 32 位 IPv4 地 址 。 要 将 地 址 202.119.9.199 赋 给 
in_addr 结构 ， 可 以 使 用 如 下 代码 : 


in_addr addr; 
addr.S un.S addr = inet addr("202.119.9.199"); 


Je, inet addr 函数 用 于 转换 点 串 IP 地 址 ， 将 在 17.2.4 节 进 行 详细 介绍 。 
由 于 有 定义 : 


#define s addr S un.S addr /* can be used for most tcp & ip code */ 
故 也 可 以 将 上 面 的 代码 简写 为 : 


in_addr addr; 
addr.s addr = inet addr("202.119.9.199"); 


假设 主机 上 有 多 块 以 太 网 卡 , 每 块 网 卡 都 配 有 IP 地 址 , 并 且 不 关心 应 用 程序 具体 使 用 哪 
个 接口 ， 那 么 在 给 addr.s addr 赋值 时 可 以 使 用 常量 一 -INADDR_ANY。 它 在 Winsock2.h 中 
被 定义 为 (u_long)0x00000000， 即 本 地 的 任意 以 太 网 接口 P 地 址 。 代 码 如 下 : 


in_addr addr; 
addr.s_addr = INADDR_ANY; 


O Sun b: 包含 4 个 8 位 无 符号 整数 ， 组 合 起 来 表示 IPv4 地 址 : s_bl.s_b2.s_b3.s_b4。 
下 面 的 例子 同样 将 IPv4 地 址 202.119.9.199 赋 给 addr。 


in_addr addr; 
addr.S un.S un b.s bl = 202; 
addr.S un.S un b.s b2 - 119; 
addr.S un.S un b.s b3 = 9; 
addr.S un.S un b.s b4 = 199; 
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17.2.3 ”通用 地 址 结构 一 一 sockaddr 


/* Structure used by kernel to store most addresses */ 
struct sockaddr { 

u short sa family; /* address family */ 

char sa data[14]; /* up to 14 bytes of direct address */ 
E 


许多 编程 人 员 可 能 会 对 通用 地 址 结构 的 存在 感到 迷惑 。 事 实 上 ， 由 于 网 络 底层 协议 的 多 
样 性 , 研究 人 员 在 最 初 设计 套 接口 函数 接口 时 , 面临 着 这 样 的 选择 : 是 专门 开发 一 套 为 TCP/P 
协议 所 用 的 API， 还 是 提供 一 种 通用 的 编程 接口 以 服务 于 多 种 网 络 协议 。 两 者 之 间 的 差别 非 
常 明 显 ， 如 果 是 采用 前 者 ， 那 么 提供 的 函数 接口 就 会 相对 简单 ， 而 对 于 后 者 ， 程 序 员 在 使 用 
时 必须 提供 足够 的 信息 〈 参 数 ) 来 告诉 接口 自己 所 采用 的 协议 族 。 以 connect HMA GZ 
函数 一 般 用 于 主动 建立 TCP 连接 ) : 


int connect (SOCKET s, const struct sockaddr FAR *name, int namelen); 


为 了 使 其 适用 于 不 同 的 网 络 协议 环境 ， 它 的 第 二 个 参数 并 不 是 struct sockadr in *， 而 是 
struct sockaddr *。 在 使 用 涉及 到 这 种 地 址 结构 的 函数 接口 时 ， 必须 强 制 将 struct sockadr in 指 
针 转 化 为 struct sockaddr 指针 。 很 多 人 会 奇怪 为 何不 采用 ANSI C 的 通用 指针 类 型 void* ， 答 
案 很 简单 ， 套 接口 函数 接口 是 在 ANSIC 标准 制定 之 前 定义 的 。 

对 于 程序 员 来 说 ， 很 少 需要 直接 使 用 通用 地 址 结构 ， 惟 一 需要 记 住 的 是 务必 进行 强制 地 
址 转换 。 


17.2.4 地址 操作 函数 


本 节 介 绍 3 个 常用 的 地 址 操作 函数 inet_addr、inet_ntoa 以 及 gethostbyname。 这 里 需要 强 
调 的 是 ， 在 使 用 Winsock 函数 之 前 ， 应 用 程序 必须 首先 调用 WSAStartup 函数 初始 化 
ws2_32.dll， 而 在 应 用 结束 后 必须 调用 WSACleanup 函数 ， 这 两 个 函数 的 详细 介绍 见 17.6.1 
节 和 17.6.10 节 。 

1. 函数 inet_addr 将 包含 点 分 格式 的 IPv4 地 址 字符 串 转 化 为 in. addr 地 址 结构 适用 的 32 
位 整数 。 其 定义 如 下 : 


unsigned long inet_addr(const char FAR *cp); 


O cp: [N], NULL 结尾 的 点 分 IPv4 字符 串 。 
O 返回 值 ， 如 果 没 有 错误 发 生 ， 函 数 返回 32 位 的 地 址 信息 。 如 果 cp 字符 串 包含 的 不 
是 合法 的 他 地址， 那么 函数 返回 INADDR_NONE。 
2. 与 inet_addr 相反 ， 函 数 inet_ntoa 将 一 个 in_addr 地 址 值 转化 为 标准 的 点 分 IP 地 址 字 
符 串 。 定 义 如 下 : 


char FAR * inet_ntoa(struct in_addr in); 


”此 处 [IN] 表 示 该 参数 为 输入 参数 ， 此 外 [OUT] 表 示 输 出 参数 ，[INOUT] 表 示 输 入 输出 参数 。 
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O in: [IN]，IPv4 地 址 结构 。 
O BE: 如 果 没有 错误 发 生 ， 函 数 inet_ntoa 返回 一 指向 包含 点 分 P 地 址 的 静态 存 
储 区 字符 指针 ， 否 则 返回 NULL。 
CO) ”注释 :保存 在 该 指针 指向 的 存储 区 中 的 信息 仅 确保 在 下 一 次 Winsock 调用 之 前 有 效 ， 
因此 应 该 及 时 加 以 复制 。 
最 后 ， 用 一 个 简单 的 例子 来 结束 对 套 接口 地 址 结构 的 介绍 ， 下 面 的 代码 片断 演示 了 如 何 
为 INET 地 址 结构 赋值 ， 并 在 connect 函数 中 使 用 该 地 址 。 再 次 强调 ， 其 中 的 WSAStartup FR 
数 用 于 初始 化 Winsock， 它 是 所 有 Winsock 应 用 程序 在 使 用 Winsock 库 之 前 都 必须 调用 的 ; 
socket 函数 用 于 创建 套 接口 ， connect 函数 用 于 连接 服务 器 ; WSACleanup 函数 用 于 结束 
Winsock 的 使 用 。 这 些 函数 的 使 用 在 后 文中 都 将 加 以 详细 介绍 。 


WSAStartup (...) 7 


SOCKET sock = socket (AF_INET, SOCK STREAM, 0); 
struct sockaddr_in to; 

memset (&to, 0, sizeof (to)); 

to.sin_addr.s_addr = inet_addr("202.119.9.199"); 
to.sin_family = AF_INET; 

to.sin_port = htons (5555); 

connect (sock, (struct sockaddr *) &to, sizeof(to)); 


WSACleanup(); 


3. 与 上 述 两 个 函数 不 同 ，gethostbyname 完成 的 是 域名 解析 功能 。 函 数 定义 如 下 : 
struct hostent FAR *gethostbyname (const char FAR *name); 


O name: [IN]， 待 解析 的 NULL 结尾 的 域名 字符 串 。 

O BA: 如 果 没 有 错误 发 生 ， 函 数 返 回 包含 域名 地 址 信息 的 HOSTENT 结构 数据 ; 
否则 返回 空 指针 (NULL)， 可 以 调用 17.6.1 节 中 介绍 的 WSAGetLastError 函数 来 获 
得 具体 的 错误 码 。 在 HOSTENT 结构 中 我 们 最 感 兴趣 的 是 h_addr list 域 ， 它 是 一 个 


NULL 结尾 的 IP 地 址 列表 。 
O 示例 : 下 面 的 代码 完成 对 www.seu.edu.cn 的 域名 解析 ， 并 输出 获得 的 TP 地 址 。 


WSAStartup (+); 


HOSTENT *host = gethostbyname ("www.seu.edu.cn"); 
struct in addr addr; 
if(host != NULL) { 
for(int i = 0; host-»h addr list[i] != NULL; i++) { 
memset (&addr, 0, sizeof (addr) ); 
memcpy (&addr.S_un.S addr, 
host-»h addr list[i], 
host-»h length); 
printf("$s: %s\n",host->h_name, inet ntoa (addr)); 


第 17 章 标准 TCP/IP 编程 接口 一 一 Socket 


WSACleanup(); 


输出 结果 如 下 : 


seic22.seu.edu.cn: 202.119.24.32 


17.3 端 ua 


从 17.2.1 节 INET 地 址 结构 的 介绍 中 可 以 发 现 ， 要 惟一 确定 一 个 INET 地 址 ， 除 了 知道 
IP 地 址 外 ， 还 需要 知道 16 位 的 端口 号 。 事 实 上 ， 当 数据 从 网 络 底层 传 来 ， 并 逐 层 解 开 至 传 
输 层 时 ， 端 口号 是 系统 了 解 应 该 将 数据 交付 哪个 应 用 程序 处 理 的 依据 。 不 同 的 服务 对 应 于 不 
同 的 端口 号 ， 这 些 端口 号 通常 被 划分 为 以 下 几 段 。 
D) “0, 不 使 用 ,如 果 你 的 应 用 程序 选择 了 0 为 端口 ,那么 系统 将 为 它 随机 分 配 一 个 1024 一 
5000 之 间 的 值 。 
口 1 一 1023， 知 名 端口 ， 限 定 为 知名 服务 使 用 ， 如 ftp 的 21 端口 、http 的 80 端口 等 。 
这 些 知名 端口 号 由 IANA 组 织 统一 管理 。 
C) “1024 一 5000， 可 以 被 任意 的 客户 端 程序 使 用 。 客 户 端 通常 对 它 所 使 用 的 端口 号 不 关 
心 ， 只 需 保证 其 惟一 性 即 可 ， 因 此 又 称 作 临 时 端口 号 〈 即 这 种 联系 的 存在 很 短暂 )。 
大 多 数 TCP/IP 实现 给 临时 端口 分 配 1024 一 5000 之 间 的 端口 号 。 
C) 5001~65535， 为 其 他 服务 器 程序 预 留 ， 这 些 服务 是 Internet 上 不 常用 的 。 如 果 需 要 
开发 自己 的 服务 器 程序 ， 就 应 该 使 用 5000 以 外 的 端口 号 。 


17.4” 字 节 序 问题 


虽然 第 3 章 讲述 了 字 节 序 的 问题 ， 这 里 需要 从 实际 编程 的 角度 重申 这 个 问题 的 重要 性 。 
不 同 的 计算 机 系统 采用 不 同 的 字 节 序 存储 数据 ， 这 为 网 络 应 用 程序 之 间 数 据 的 交互 造成 了 很 
大 的 麻烦 。 同 样 一 个 两 字 节 的 16 位 整数 ， 在 内 存 中 存储 的 方法 不 同 : 一 种 是 将 低 字 节 存储 
在 起 始 地 址 ， 称 为 “Little-Endian” 字 节 序 ， 由 Intel 等 体系 结构 采用 ; 另 一 种 是 将 高 字 节 存 
储 在 起 始 地 址 ， 称 为 “Big-Endian” 字 节 序 ， 由 Macintosh 等 体系 结构 采用 。 以 16 位 整数 
0x0102 为 例 ， 两 种 方式 下 内 存 布局 情况 如 图 17.2 所 示 。 

通常 把 某 给 定 系 统 所 用 的 字 节 序 称 为 主机 字 节 序 ， 而 把 网 络 标准 的 “Big-Endian ” 称 为 
网 络 字 节 序 。 由 于 两 种 字 节 序 都 广 为 使 用 ， 这 就 给 不 同类 别 主机 之 间 的 网 络 数据 交互 设计 带 
来 了 一 定 的 麻烦 。 为 了 解决 这 个 问题 , 在 套 接口 API 中 提供 了 一 组 字 节 序 处 理 函数 一 一 htonx、 
ntohx, HF h 表示 host, n 表示 network, x 或 者 是 s (short) 或 者 是 1 Cong) 。 作 为 编程 人 
员 ， 只 需要 简单 地 调用 这 些 函数 ， 而 不 用 考虑 本 地 的 字 节 序 与 网 络 序 是 否 有 差别 。 

1. htons 函数 将 一 个 无 符号 的 短 整 型 数 C16 位 ) 转化 为 “Big-Endian” 的 网 络 字 节 序 。 
定义 如 下 : 
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u_short htons(u short hostshort) ; 


内 存 地 址 增 大 方向 


> 

| 地 址 A | 地 址 At | 

Big-Endian | 01 | o | 
Little-Endian | 02 | 01 | 
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O hostshort: [IN], 16 位 的 主机 序 短 整 型 数 。 

O ”返回 值 : 变换 为 网 络 序 的 值 。 

2. ntohs 函数 操作 与 htons 恰恰 相反 ， 它 将 一 个 网 络 序 的 16 位 无 符号 整数 转化 为 主机 
序 。 定 义 如 下 : 


u short ntohs(u short netshort); 


O netshort: [IN], 16 位 的 网 络 序 短 整 型 数 。 

O ”返回 值 : 返回 主机 序 的 值 。 

3. htonl. ntohl 函数 分 别 与 htons 和 ntohs 相同 ， 差 别 仅 在 于 这 两 个 函数 操作 的 是 32 位 
的 无 符号 长 整 型 数 。 


17.5 三 种 套 接口 类 型 和 两 种 VO 模式 


175.1 套 接 口 的 类 型 


套 接口 是 网 络 通信 端点 的 一 种 抽象 概念 ， 它 向 应 用 程序 提供 数据 发 送 和 接收 的 功能 。 进 
行 网 络 编程 时 经 常会 碰 到 三 种 基本 的 套 接口 类 型 : SOCK STREAM, SOCK DGRAM 和 
SOCK RAW。 

O SOCK STREAM: 流 套 接口 ， 对 应 于 TCP 协议 ， 向 应 用 程序 提供 可 靠 的 面向 连接 

的 数据 传输 服务 。 也 称 面向 连接 的 套 接口 、TCP 套 接口 等 。 

O SOCK DGRAM: 数据 报 套 接 口 ， 对 应 于 UDP 协议 ， 向 应 用 程序 提供 不 可 靠 的 、 非 

连接 的 数据 报 通信 方式 。 也 称 无 连接 套 接口 、 面 向 消息 套 接口 、UDP 套 接 口 等 。 

O SOCK RAW: 原始 套 接口 ， 可 以 读 写 ICMP. IGMP 报 文 ， 可 用 于 从 IP 头 起 构造 自 

己 的 报 文 。 


175.2 1/0 模式 


套 接口 VO 模式 是 指 套 接口 进行 输入 、 输 出 时 调用 的 那些 函数 操作 的 工作 模式 。Winsock 
支持 两 种 IO 模式 : 阻塞 (BLOCK) 和 非 阻 塞 (NONBLOCK) . 
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在 阻塞 模式 下 ，IO 操作 完成 前 ， 执 行 该 操作 的 Winsock 函数 (比如 send/sendto 和 
recv/recvfrom) 不 会 立即 返回 ， 它 会 一 直 等 待 下 去 直到 所 需 进行 的 操作 完成 为 止 。 

在 非 阻塞 模式 下 ，Winsock 函数 无 论 操作 是 否 已 完成 ， 都 会 立即 返回 。 通 常会 发 现 这 些 
函数 操作 失败 ， 并 且 会 得 到 WSAEWOULDBLOCK 的 错误 码 。 它 意味 着 所 进行 的 函数 操作 
在 函数 调用 的 这 段 时 间 内 没有 完成 ， 必 须 重新 进行 尝试 。 

阻塞 模式 与 非 阻塞 模式 相 比较 ， 从 编程 角度 来 说 前 者 更 便于 使 用 ， 但 从 程序 运行 的 效率 
来 说 ， 由 于 阻塞 调用 会 使 得 所 在 的 线程 (如 果 是 主线 程 那么 就 是 整个 程序 ) 等 待 在 该 IO 操 
作 上 ， 因 此 后 者 的 效率 更 高 。 

默认 情况 下 , Winsock 函数 都 以 阻塞 模式 进行 工作 。 这 些 函 数 主要 涉及 到 连接 (connect) 、 
接受 连接 (accept) 、 发 送 数 据 、 接 收 数据 、 关 闭 套 接口 等 。 可 以 使 用 ioctlsocket 函数 来 改 
变 套 接口 的 IO 模式 ， 其 函数 定义 如 下 : 


int ioctlsocket (SOCKET s, long cmd, u long FAR *argp); 


其 中 s 是 待 处 理 的 套 接口 描述 字 〈 简 称 套 接 字 ， 与 套 接口 概念 有 所 不 同 ) ，cmd 是 对 该 
套 接口 进行 的 操作 (模式 修改 ), argp 是 cmd 的 参数 。 其 中 cmd 可 以 是 FIONBIO, FIONREAD 
或 者 SIOCATMARK, 这 里 只 介绍 FIONBIO, 该 命令 用 于 开启 /禁止 套 接 口 的 非 阻塞 IO 模式 。 
在 下 面 两 段 代 码 中 ， 套 接口 s 分 别 工作 在 非 阻塞 模式 和 阻塞 模式 下 。 


// 代码 段 1， 使 用 非 阻塞 模式 

u_long bNonblock = 1; 
if (ioctlsocket (sock, FIONBIO, &bNonblock) == SOCKET _ERROR) { 
HandleError ("ioctlsocket") ; 


) 

// 代码 段 2: 禁止 非 阻塞 模式 ， 即 使 用 阻塞 模式 

u_long bNonblock = 0; 
if (ioctlsocket (sock, FIONBIO, &bNonblock) == SOCKET_ERROR) { 
HandleError ("ioctlsocket") ; 


} 


但 是 ， 由 于 非 阻塞 调用 会 频繁 返回 WSAEWOULDBLOCK 错误 ， 所 以 在 任何 时 候 ， 都 
应 仔细 检查 返回 的 错误 代码 ， 并 做 好 调用 失败 的 准备 。 如 果 每 次 碰 到 WSAEWOULDBLOCK 
错误 时 ， 只 是 简单 地 等 待 然后 再 次 调用 该 IO 函数 ， 那 么 这 种 轮 询 工作 方式 的 效率 甚至 会 低 
于 阻塞 IO 方式 。 如 何 充 分 利用 非 阻 塞 IO 带 来 的 效率 提高 ， 将 在 18 章 Winsock 的 IO 模型 
中 进行 介绍 。 


17.6 基本 套 接口 函数 


C/S 结构 是 网 络 应 用 系统 的 常见 模型 ，Sockets 接口 可 以 很 好 地 满足 客户 端 和 服务 器 之 间 
进行 通信 的 需求 。 以 开发 一 个 基于 TCP 的 服务 器 程序 为 例 ， 通常 的 流程 是 这 样 的 : 首先 初始 
化 Winsock, 创建 一 个 Socket， 绑 定 并 监听 本 地 的 某 个 特定 端口 ，accept 接受 客户 端的 连接 ， 
在 accept 操作 返回 的 Socket 上 进行 数据 通信 ， 关 闭 Socket， 最 后 结束 Winsock 的 使 用 。 下 面 
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大 致 按照 这 个 顺序 介绍 需要 调用 的 函数 。 
"m 17.6.1 WSAStartup 


与 伯克利 套 接口 API 不 同 ， 在 使 用 Winsock 库 函数 之 前 ， 必 须 先 调用 函数 WSAStartup, 
该 函数 负责 初始 化 动态 连接 库 Ws2_32.dll。 函 数 定 义 如 下 : 


int WSAStartup (WORD wVersionRequested, LPWSADATA lpWSAData); 


O wVersionRequested: [IN], —^ WORD (WF) 型 数值 ， 指 定 了 应 用 程序 需要 使 
用 的 Winsock 规范 的 最 高 版 本 。 其 中 主 版 本 号 在 低 字 节 ， 次 版 本 号 在 高 字 节 。 如 果 
对 版 本 并 不 关心 ， 那 么 可 以 直接 将 常量 值 WINSOCK VERSION 赋 给 
wVersionRequested， 该 常量 在 Winsock2.h 中 定义 ,表示 当前 的 Winsock 版 本 。 假设 
希望 的 版 本 号 是 1.2《〈 演 示 ， 实 际 不 存在 )， 那 么 可 以 使 用 如 下 代码 : 
wVersionRequested = 0x0201, 或 者 wVersionRequested = MAKEWORD (1,2)， 其 中 
MAKEWORD 是 一 个 宏 定 义 ， 可 将 两 个 字 节 组 装 成 一 个 WORD. WORD 
MAKEWORD(BYTE blow, BYTE bHigh) 换 成 版 本 号 就 应 该 是 MAKEWORD(BYTE 
bMainVersion, BYTE bLowVersion)。 

口 IpWSAData: [OUT]， 指 向 WSADATA 数据 结构 的 指针 ， 该 结构 用 于 返回 本 机 的 
Winsock 系统 实现 的 信息 。 经 常 使 用 的 是 该 结构 的 WhighVersion 和 wVersion 两 个 域 ， 
前 者 表示 系统 支持 的 最 高 版 本 ， 后 者 是 系统 希望 调用 者 使 用 的 版 本 。 

O 返回 值 :如 果 函 数 操作 成 功 ,返回 0; 否则 返回 错误 码 。 需 要 注意 的 是 ,由 于 ws2_32.dll 
尚未 初始 化 ， 此 时 无 法 调用 函数 WSAGetLastError。WSAGetLastError 是 Winsock 
提供 的 辅助 函数 ， 当 调用 Winsock 函数 出 错时 ， 可 以 使 用 该 函数 查 出 系统 的 出 错 代 
码 ， 其 函数 定义 如 下 : 


int WSAGetLastError (void); 


O 注释 : WSAStartup 是 任何 使 用 Winsock 的 应 用 程序 或 者 DLL 首先 必须 调用 的 
Winsock 库 函 数 。 一 方面 它 完成 初始 化 ws2_32.dll 


的 工作 , 另 一 方面 它 也 可 用 于 在 应 用 程序 (或 DLL) vu 

与 系统 Winsock 库 之 间 进行 版 本 协商 。 只 有 当 应 用 

要 求 的 版 本 (希望 使 用 的 Winsock 的 最 高 版 本 ) 等 

于 或 者 高 于 系统 支持 的 最 低 版 本 下限)， 那 么 该 quim 
函数 操作 成 功 并 且 在 WSADATA.WhighVersion 中 本 

返回 系统 支持 的 最 高 版 本 , 在 WSADATA.wVersion 

中 返回 系统 支持 的 最 高 版 (上限 ) 和 NS 


wVersionRequested 之 间 的 较 小 值 , 也 就 是 系统 希望 
使 用 的 版 本 号 。 此 时 应 该 判断 该 版 本 是 否 合适 。 
D 示例 ， 见 如 下 代码 : 


Mdoeeeeeeeeeeeeeeoeeeeoeeee BIE17.1 WSAStartup **4 4 2A RRA RAIA REI 


#pragma comment (lib, "ws2 32.1ib") 
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#include <STDIO.H> 
#include <WINSOCK2.H> 


int main(int argc, char* argv[]) 
{ 
WSAData wsaData; 
WORD wVersionReq = MAKEWORD(0, 1); 
int ret = WSAStartup(wVersionReq, &wsaData) ; 
if(ret != 0){ 
printf ("%d\n", ret); 
return -1; 
} 
else{ 
printf ("High: $x Use: %x\n", wsaData.wHighVersion, wsaData.wVersion) ; 
WSACleanup () ; 
return 0; 
} 
} 


FOI III III KO JO OK ROC KO ROO KO ROCCO ROC ROC AGRO OK TOI ICICI Kee eje ek 


其 中 一 些 代码 ， 如 第 一 行 知 ragma 的 使 用 ， 读 者 可 以 暂时 不 予 理 会 ， 我 们 将 在 本 章 的 最 
后 一 节 给 出 一 个 完整 的 例子 并 进行 详细 的 分 析 。 表 17.1 给 出 了 在 指定 不 同 的 输入 参数 
wVersionReq 时 程序 的 输出 结果 。 


表 17.1 版 本 协商 输出 结果 
WVersionReq [EE 
MAKEWORD(0.1) 0.1 低 于 系统 的 最 低 版 本 ， 出 错 
0x0002 系统 最 高 支持 2.2 版 本 ， 建 议 使 用 2.0 版 本 


MAKEWORD(3.1) 希望 使 用 3 1 版 本 :| 系统 最 高 支持 2.2 版 本 ， 建 议 使 用 2.2 版 本 
202 
-——— :| 系统 最 高 支持 22 版 本 ， 建 议 使 用 2.2 版 本 
202 
17.6.2 socket 


在 初始 化 Winsock 的 使 用 后 ， 就 可 以 调用 socket 函数 来 创建 套 接口 了 ， 函 数 定义 如 下 : 


SOCKET socket (int af, int type, int protocol); 


O af: [IN]， 指 定 协议 族 ， 一 般 都 为 AF_INET， 对 应 于 internet 协议 。 

口 type: [IN]， 指 定 套 接口 类 型 ， 常 用 的 有 3 种 ， 如 表 17.2 所 示 。 

O protocol: [IN]， 指 定 所 用 的 协议 。 

O 返回 值 ， 如 果 没 有 错误 发 生 ， 函 数 返 回 一 个 新 的 套 接口 的 描述 字 ， 否 则 返回 常量 值 
INVALID_SOCKET， 此 时 可 以 调用 WSAGetLastError 来 查 出 系统 的 错误 代码 。 


WINSOCK_VERSION 
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C) 注释 : SOCKET 是 Winsock 定义 的 套 接口 类 型 ， 但 事实 上 ， 与 Berkeley 标准 API 
一 样 ， 它 本 质 上 是 一 个 整 型 数 。 在 Winsock2.h H, SOCKET 被 定义 为 : 


typedef u_int SOCKET; 


R172 BORD 


SOCK STREAM | 提供 可 靠 的 、 双 向 的 、 基 于 连接 的 字 节 流传 输 服务 ， 对 应 于 TCP 协议 
提供 不 可 靠 的 、 非 连接 的 数据 报 服务 ， 通 常 这 种 数据 报 大 小 固定 并 且 较 小 ， 对 应 于 
UDP 协议 


SOCK_DGRAM 


可 以 读 写 ICMP. IGMP 分 组 ， 可 以 读 写 内 核 不 处 理 的 包含 特殊 IP 协议 段 的 IP ROC, 
利用 原始 套 接口 加 上 IP_HDRINCL 选项 可 以 构造 自己 的 卫 报 头 


SOCK RAW 


在 创建 SOCKET 时 ， 对 于 TCP, UDP KH, socket 函数 的 第 三 个 参数 通常 可 以 设置 为 0 
(这 是 因为 根据 AF INET + SOCK STREAM/SOCK DGRAM， 即 可 惟一 确定 所 使 用 的 协 
议 ) ， 只 有 需要 创建 原始 套 接口 ， 才 需要 设置 protocol 参数 。 
O 示例 : 下 面 3 段 代 码 分 别 创建 TCP、UDP 和 原始 套 接口 (ICMP 协议 )。 


SOCKET sock = socket (AF_INET, SOCK STREAM, 0); 
SOCKET sock = socket (AF_INET, SOCK DGRAM, 0); 
SOCKET sock = socket (AF_INET, SOCK RAW, IPPROTO ICMP); 


17.6.3 bind 


bind 函数 将 一 个 本 地 的 传输 层 地 址 与 已 创建 的 套 接 口 联系 起 来 。 一 般 来 说 ， 作 为 客户 端 
程序 ， 不 用 关心 它 的 本 地 地 址 是 什么 ， 也 就 没有 必要 调用 bind 函数 ， 系 统 会 在 通信 之 前 (对 
于 TCP， 通 常 是 在 客户 端 connect 或 者 服务 器 端 listen; 对 于 UDP 是 在 sendto) 自动 为 它 选 
择 一 个 本 地 地 址 (端口 一 般 为 1024 一 5000， 端 口 的 选择 见 17.3 节 ) 加 以 绑 定 。 服 务 进 程 则 
必须 要 绑 定 到 一 个 为 客户 端 所 知 的 地 址 上 , 所 以 在 接受 连接 或 接收 数据 报 之 前 必须 调用 bind。 
无 论 是 显 式 地 调用 bind 函数 , 还 是 由 系统 隐 式 地 进行 地 址 绑 定 , 我 们 都 将 此 时 的 套 接口 称 为 
已 绑 定 套 接口 。 函 数 定义 如 下 : 


int bind(SOCKET s, const struct sockaddr FAR *name, int namelen); 


DO s: N] 未 绑 定 的 套 接口 描述 字 。 

O name: [IN]， 指 向 供 套 接口 使 用 的 本 地 地 址 的 通用 地 址 指针 。 

O namelen: [IN], name 参数 的 长 度 。 

D 返回 值 ， 如 果 没 有 错误 发 生 ， 函 数 返 回 0; 否则 返回 SOCKET_ERROR， 可 以 调用 
WSAGetLastError 来 获取 具体 的 错误 代码 。 一 个 常见 的 错误 是 WSAEADDRINUSE, 
将 在 稍 后 介绍 服务 器 设计 时 讨论 这 个 问题 。 

O 注释 : 该 函数 尤其 需要 注意 的 是 第 二 个 参数 。 在 填充 地 址 信息 时 , 通常 都 使 用 INET 
地 址 结构 ， 因 此 在 调用 函数 时 必须 进行 强制 转换 。 

O 对 于 多 穴 主 机 ， 绑 定 地 址 时 ， 或 者 选择 其 中 一 个 接口 或 者 选择 任意 接口 

(CINADDR_ANY), 不 能 选择 绑 定 其 中 的 若干 接口 。 表 17.3 显示 了 在 一 个 多 网 络 接 
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口 主机 环境 下 ， 为 套 接口 指定 不 同 的 地 址 数据 的 结果 。 


表 17.3 ”端口 和 地 址 的 绑 定 
IP mom y 
INADDR ANY 内 核 选 择 某 适 配器 的 地 址 和 1024— 5000 之 间 的 端口 
INADDR_ANY 内 核 选 择 某 适 配器 的 地 址 ， 进 程 指定 端口 
本 地 一 适配器 地 址 进程 指定 IP 地 址 ， 内 核 选择 1024 一 5000 之 间 的 端口 
本 地 一 适配器 地 址 进程 指定 卫 地址 和 端口 


D) 示例 :下 面 的 代码 创建 了 一 个 流 套 接口 ,并 绑 定 至 本 地 IP-202.119.9.199 的 9999 3jj 
H. 


SOCKET sock - socket(AF INET, SOCK STREAM, 0); 
struct sockaddr in local; 

memset(&local, 0, sizeof(local)); 

local.sin addr.s addr - inet addr("202.119.9.199"); 
local.sin family = AF INET; 

local.sin port - htons(9999); 


if (bind (sock, (struct sockaddr *) &local, sizeof (local)) == SOCKET ERROR)( 
printf("Error: $dWMn", WSAGetLastError()); 
WSACleanup(); 
return -1; 
) 
17.6.4 listen 


该 函数 仅 被 TCP 服务 器 端 使 用 , 负责 通知 协议 内 核 用 户 进程 准备 接收 套 接口 上 的 连接 请 
它 同 时 也 指定 了 在 该 套 接口 上 可 以 排队 等 待 的 连接 数 的 门限 值 。 函 数 定义 如 下 : 


int listen(SOCKET s, int backlog); 


O s [IN]， 已 绑 定 但 尚未 连接 的 套 接口 描述 字 。 

O backlog: [IN]， 待 处 理 的 连接 队列 的 最 大 长 度 。 如 果 设 置 为 常量 值 SOMAXCONN， 
底层 的 网 络 服务 驱动 会 自动 为 该 套 接 口 设 置 最 大 的 队列 长 度 值 。 

C) ”返回 值 : 如 果 没 有 错误 发 生 ， 函 数 返回 0; 否则 返回 SOCKET ERROR， 同样 可 以 
调用 WSAGetLastError 以 获取 具体 的 错误 码 。 

O $R: TCP 套 接口 有 主动 套 接口 和 被 动 套 接口 之 分 ， 当 调用 socket 函数 创建 一 个 流 
SOCKET 时 ， 系 统 会 假设 该 套 接口 为 主动 ， 这 时 可 以 调用 connect 函数 以 主动 发 起 
连接 ， 这 就 是 客户 端 SOCKET; 如 果 调 用 的 不 是 connect 而 是 listen 函数 ， 那 么 系 
统 将 该 未 连接 SOCKET 改 为 被 动 ， 并 接受 指向 它 的 连接 请 求 ， 这 就 是 服务 器 端 
SOCKET， 也 称 监 听 套 接口 。 

系统 为 每 一 个 监听 套 接口 维护 一 个 待 处 理 连接 的 队列 ， 该 队列 由 两 个 子 队列 组 成 : 未 完 

成 连接 队列 和 已 完成 连接 队列 ， 区 分 的 标准 是 是 否 已 完成 TCP 三 步 握手 ， 如 图 17.3 所 示 。 


求 
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客户 端 connect, 
进行 三 步 握手 


服务 器 端 accept 


三 步 握手 完毕 


SERB 


SERRA 


图 17.3 连接 队列 


因此 ， 有 参数 backlog = 待 处 理 连 接 队 列 长 度 = 未 连接 队列 长 度 + 已 连接 队列 长 度 。 

DO 示例 : 用 一 个 小 例子 来 演示 如 何 创建 服务 器 端的 监听 套 接口 ， 并 根据 这 个 例子 来 检 
测 在 Windows 系统 下 backlog 值 的 意义 。 该 程序 的 设计 非常 简单 ， 取 不 同 的 
BACKLOG 常量 值 为 流 套 接口 调用 listen 函数 ， 然 后 Sleep 足够 长 时 间 ， 使 服务 器 
无 法 处 理 进入 的 连接 请 求 ， 同 时 客户 端 发 起 多 次 connect 连接 ， 根 据 返 回 值 来 判断 
服务 器 的 连接 队列 的 状态 。 


SOCIO RRA KIRA RAR AA RARE 程序 了 7。2 Listen JJ4J9 4X 4 kk RARER REAR REE 


#pragma comment (lib, "ws2_32.lib") 


#include <STDIO.H> 
#include <WINSOCK2.H> 


#define BACKLOG 1024 


int main(int argc, char* argv[]) 
{ 
WSAData wsaData; 
WSAStartup (WINSOCK_VERSION, &wsaData) 7 


SOCKET sock = socket (AF_INET, SOCK STREAM, 0); 

struct sockaddr_in local; 

memset (&local, 0, sizeof(local)); 

local.sin addr.s addr = INADDR_ANY; 

local.sin family - AF INET; 

local.sin port = htons (9999); 

bind(sock, (struct sockaddr *) &local, sizeof(local)); 


if(listen(sock, BACKLOG) == SOCKET ERROR) { 
printf("Listen error %d!\n", WSAGetLastError()); 
} 


Sleep (1000000); 
closesocket (sock) ; 
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WSACleanup(); 
return 0; 


} 
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A BACKLOG 常量 设置 不 同 的 值 ， 有 如 下 结果 : 

() BACKLOG = 0, 当 第 2 个 连接 到 来 时 , 服务 器 直接 返回 TCP-RST 报 文 ,客户 端 connect 
返回 10061 错误 CWSAECONNREFUSED - Connection refused) 。 

@ BACKLOG = 1, 当 第 2 个 连接 到 来 时 , 服务 器 直接 返回 TCP-RST 报 文 ,客户 端 connect 
返回 10061 错误 。 

() BACKLOG = 2, 当 第 3 个 连接 到 来 时 , 服务 器 直接 返回 TCP-RST 报 文 , 客 户 端 connect 
返回 10061 错误 。 

@ BACKLOG = 6, 当 第 7 个 连接 到 来 时 ,服务 器 直接 返回 TCP-RST 报 文 ,客户 端 connect 
返回 10061 错误 。 

© BACKLOG =1024， 当 第 202 个 连接 到 来 时 ， 服 务 器 直接 返回 TCP-RST 报 文 ， 客 户 
端 connect 返回 10061 错误 。 

由 此 可 以 得 出 结论 , 假设 系统 的 待 处 理 连接 队列 长 度 为 X, 当 backlog 不 在 1~X 范围 内 
时 ， 系 统 会 自动 将 其 改 为 临近 的 可 接受 的 值 ， 即 如 果 backlog<1， 则 改 为 1， 如 果 backlog>X， 
则 改 为 X， 当 连接 队列 已 满 ， 并 有 新 的 客户 连接 进来 时 ，Win2000 系统 会 直接 返回 TCP-RST 
报 文 ， 因 此 客户 端 connect 会 直接 收 到 错误 反馈 。 这 种 处 理 方式 与 Unix 系统 不 同 ， 事 实 上 ， 
忽略 后 续 SYN 报 文 还 是 返回 TCP-RST 都 是 POSIX 标准 所 允许 的 ,历史 上 ,所 有 源 于 Berkeley 
的 UNIX 实现 都 是 忽略 新 的 SYN 请 求 。 


17.6.5 accept 


TCP 服务 器 套 接口 在 调用 了 listen 之 后 , 还 应 该 调用 accept 来 等 待 接受 连接 请 求 。accept 
函数 定义 如 下 : 


SOCKET accept (SOCKET s, struct sockaddr FAR *addr, int FAR *addrlen); 


O s: [IN]， 处 于 监听 状态 的 套 接口 描述 字 。 

O addr: [OUT]， 用 于 接收 外 来 连接 的 地 址 信息 。 可 选 。 如 果 暂 时 不 关心 该 地 址 信息 ， 
那么 可 以 输入 NULL。 

C) addrlen: [INOUT]， 这 是 第 一 次 碰 到 INOUT 类 型 的 参数 ， 也 可 以 称 为 值 -结果 类 型 
参数 。 这 种 参数 一 方面 接收 调用 者 给 出 的 输入 值 ， 一 方面 用 于 返回 结果 。 在 调用 
accept 函数 前 , 应 该 将 addrlen 设 定 为 由 addr 所 指 的 INET 地 址 结构 的 长 度 ; 调用 完 
毕 后 ，addrlen 会 返回 内 核 保存 该 地 址 所 用 存储 空间 的 精确 字 节 数 。 如 果 输 入 的 
addrlen 值 小 于 内 核 所 需 的 存储 空间 大 小 ， 那 么 函数 调用 将 返回 错误 10014 
CWSAEFAULT - Bad address)。 可 选 。 

O 返回 值 ， 如 果 没 有 错误 发 生 ， 返 回 一 个 新 的 已 连接 套 接口 的 描述 字 ;， 否则 返回 
INVALID SOCKET. 

O 注释: 如 果 没 有 错误 发 生 ，accept 函数 将 返回 一 个 新 的 已 连接 的 套 接口 描述 字 ( 称 
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之 为 服务 套 接 口 )， 该 套 接口 绑 定 了 本 地 的 网 络 地 址 与 监听 端口 ， 同时， 原 有 的 监 
听 套 接口 将 仍然 处 于 监听 状态 ， 新 的 连接 请 求 可 以 通过 再 次 的 accept 调用 而 获得 接 
受 。 一 般 情况 下 ， 服 务 器 会 同时 处 理 很 多 并 发 连接 ， 那 么 也 就 存在 着 很 多 服务 套 接 
口 , 那么 应 用 程序 如 何 知道 发 往 本 地 的 同一 端口 的 TCP 数据 该 由 哪个 服务 套 接口 来 
处 理 呢 ? 事实 上 ， 系 统 内 核 解决 了 该 问题 ， 每 个 TCP 连接 都 由 < 源 他， 源 端 口 > 一 < 
目的 耳 ， 目 的 端口 > 惟一 确定 ， 内 核 会 根据 TCP 数据 的 源 地 址 /目的 地 址 ， 自 动 将 数 
据 放 入 与 该 地 址 相对 应 的 套 接口 的 数据 缓冲 区 中 。 

当 调 用 accept 时 输入 的 第 二 、 三 个 参数 都 为 空 指针 时 , 函数 将 不 返回 连接 发 起 方 的 地 址 ， 

如 果 此 后 《必须 在 断 开 连接 之 前 ) 需要 了 解 该 信息 ， 那 么 可 以 使 用 函数 : 


int getpeername (SOCKET s, struct sockaddr FAR *name, int FAR *namelen); 


其 中 s 是 已 连接 的 套 接口 的 描述 字 Caccept 的 返回 值 ) ，namelen 是 INOUT 类 型 参数 。 与 该 
函数 相对 应 ， 如 果 想 知道 本 地 某 个 已 绑 定 套 接 口 的 地 址 信息 ， 那 么 可 以 使 用 函数 : 


int getsockname (SOCKET s, struct sockaddr FAR *name, int FAR *namelen); 


需要 注意 的 是 如 果 该 套 接 口 尚未 绑 定 ， 或 者 绑 定 了 INADDR ANY 地 址 但 尚未 调用 
connect 函数 ， 那 么 函数 将 返回 10022 错误 CWSAEINVAL) 。 
O 示例 : 下 面 的 代码 完成 了 接受 连接 并 输出 对 方 地 址 的 功能 ， 其 中 sock 是 TCP 监听 
套 接口 。 


struct sockaddr_in from; 

int len = sizeof (from); 

if (accept (sock, (struct sockaddr *) &from, &len) == SOCKET ERROR) { 
printf("accept :%d", WSAGetLastError()); 

) 


else( 
printf("%s\n", inet ntoa(from.sin addr)); 


) 


17.6.6 connect 


在 17.6.4 节 中 提 到 ， 对 于 流 套 接 口 有 主动 和 被 动 之 分 。 在 客户 端 ， 当 创建 了 一 个 主动 套 
接口 后 ， 就 可 以 使 用 connect 函数 来 连接 服务 器 。 但 是 ， 这 并 不 是 说 只 有 面向 连接 的 套 接口 
才能 调用 connect 函数 ， 在 下 文 将 对 这 个 问题 进行 详细 的 分 析 。 函 数 定义 如 下 : 


int connect (SOCKET s, const struct sockaddr FAR *name, int namelen); 


DO s [IN]， 未 绑 定 的 套 接口 描述 字 。 

O name: [IN]， 指 向 目标 地 址 的 指针 ， 目 标 地 址 中 必须 包含 P 和 端口 信息 。 

O namelen: [IN], name 的 长 度 。 

D 返回 值 ， 如 果 没 有 错误 发 生 ， 返 回 0;， 否则 返回 SOCKET ERROR. 

O R: connect 函数 既 可 用 于 面向 连接 套 接口 ， 也 可 用 于 无 连接 套 接口 ,两 种 情况 下 
的 作用 是 不 同 的 。 
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分 ”无 连接 套 接口 : 对 于 无 连接 的 套 接口 (例如 SOCK_DGRAM)，connect 函数 仅仅 起 
到 在 该 套 接 口 与 目标 地 址 之 间 建 立 默认 的 对 应 关系 的 作用 ， 没 有 任何 网 络 数据 〈 协 
议 ) 的 交互 发 生 。 在 comect 之 后 ， 套 接口 变 为 已 绑 定 和 已 连接 状态 ， 这 时 可 以 直 (i7 
接 使 用 send， 而 不 是 用 sendto 来 向 该 地 址 发 送 数据 ; 同时， 内 核 会 丢弃 所 有 发 送 给 
该 套 接口 的 源 地 址 不 是 connect 地 址 的 报 文 。 如 果 要 变更 这 种 关系 ， 可 以 再 次 调用 
connect 函数 : 如 果 此 时 name 和 namelen 两 个 参数 均 为 空 指针 ， 那 么 就 会 将 该 套 接 
口 恢 复 为 未 连接 状态 ， 此 时 再 调用 send 函数 ， 系 统 会 提示 WSAENOTCONN 错误 
码 。 

> “面向 连接 套 接口 : 对 于 面向 连接 的 套 接口 (SOCK_STREAM), 函数 connect 会 引起 
调用 端 主动 进行 TCP 的 三 次 握手 过程。 其 结果 通常 是 成 功 连接 、WSAETIMEDOUT 
(多 次 发 送 SYN 报 文 ， 始 终 未 收 到 回复 )、WSAECONNREFUSED (目标 主机 返回 
TCP-RST) 等。 从 图 17.4 中 可 以 看 到 系统 为 一 次 成 功 的 connect 所 作 的 网 络 交互 ( 连 
接 202.119.24.32 的 80 端口 )。 


[O capture = Nera  - 半 


File Edi Dapture Display Tools Help 


119.9.2007 Tell 202.119, 9.99 
Nans Name query NB WORKGROUP-<L b> 
5 Nane query NB OD-OFFICE 20> 


is Nane query NB WORKGROI 
Conf. ROO: = 8192/00: 


= 18 Port = UXSULL 


DHCP Discover ~ Transaction ID Ox7f2b3 
NBNS Name query NB WORKGROUP-<Lb> 

NBNS Nana query NB DB-OFFICE<20> 

NSNS Name query NB WORKGROUP-<LC> 

aap who has 202.110.9.1937 Te11 202.110.0.115 
MONS Name query NO WORKGROUP<Lb> 

BROW Request Announcement WATERMAN 

NBNS Nane query NB WORKGROUP<Lc> H 
fffffftt- IPX unknown Coxd7dr) 

ree-(for-| STP Conf. Root = R102/00:00:7b:51:b8:30 Cost = 18 Port = Ova011 
255 NONS Nane query NE WORKGROUP LC> r| 


Rr T z 
Frame 12 (62 bi E 
Bethernet 22, 5 :3a:67:dc. 
B Internet Proto. 9), Ust Addr: seicz2.seu.edu.cn (202.119.24. 
E transmission contre] Protocol, Sec Pore: 2131 (i1319, bet Font! Mtp (80). segi 413698005, Ack? 0, Len: O 

H 


6565 00 do d3 3a 67 dc 00 of 35 98 0a 7c 08 00 45 00 
UULO Q0 30 al 19 40 UU SO 06 a2 dë ca 77 09 C7 ca 77 
0020 18 20 04 6b 00 50 f6 90 do 7t O0 00 00 00 70 02 
0o30 FF FF 00 7e 00 00 02 04 05 bt OL 01 04 02 


Filter || | Reset] Appwj File: <capture> Drops 0 


图 17.4 connect 引起 的 网 络 数据 交互 


17.6.7 recv 和 send 


recv 函数 从 套 接 口 接收 数据 ， 该 套 接口 可 以 是 面向 连接 的 ， 也 可 以 是 无 连接 的 。 如 果 是 
面向 连接 的 套 接口 , 那么 它 必 须 是 已 连接 的 ; 如 果 是 无 连接 套 接口 ,那么 它 必 须 是 已 绑 定 的 。 
函数 定义 如 下 : 
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int recv(SOCKET s, char FRR *buf, int len, int flags); 


a 


a 
g 
口 


a 


+ 


s: [IN]， 套 接口 描述 字 。 

buf: [OUT]， 用 于 接收 数据 的 缓冲 区 指针 。 

len: [IN]， 应 用 程序 提供 的 缓冲 区 大 小 。 

flags: [IN], UE recv 方式 的 标志 值 ，MSG _PEEK 或 者 MSG_OOB。 前 者 用 于 把 输 
入 队列 中 的 数据 读 至 用 户 缓冲 区 ， 但 是 并 不 相应 地 将 该 数据 从 输入 队列 中 删除 ; 后 
者 用 于 读 取 带 外 数据 。 通 常 把 该 参数 置 为 0。 

返回 值 : 如 果 没 有 错误 发 生 ，recv 返回 接收 的 字 节 数 ; 否则 返回 SOCKET ERROR. 
需要 注意 的 是 ， 返 回 结果 0 并 不 表明 有 错误 发 生 : 如 果 是 UDP 套 接口 ， 那 么 说 明 
读 到 了 一 个 没有 应 用 数据 的 纯 UDP 头 报 文 ， 如 果 是 TCP 连接 ， 这 就 意味 着 对 方 已 
关闭 了 连接 。 

注释 : 对 于 recv 函数 的 使 用 ， 在 面向 连接 和 非 连接 的 套 接 口中 是 不 同 的 。 通 常情 况 
F, recv 函数 应 用 于 流 套 接口 。 

面向 连接 (SOCK. STREAM) 


调用 recv 之 前 , 套 接口 必须 是 已 连接 的 ; recv 函数 只 接收 来 自己 连接 的 远 端 地 址 的 数据 。 
每 次 recv 调用 都 将 能 读 取 当 前 可 获得 的 所 有 数据 ,如 果 可 读 取 数 据 量 比 用 户 缓冲 区 大 , 那么 
recv 操作 将 先 读 取 前 面部 分 的 数据 , 因此 无 法 保证 一 次 recv 操作 就 能 将 所 需要 的 数据 全 部 读 
到 ， 所 以 可 以 将 recv 编码 在 一 个 循环 中 ， 直 到 读 取 了 所 有 需要 的 数据 ， 或 者 recv 返回 为 0 
(表明 远程 端口 关闭 连接 ) BK SOCKET. ERROR (错误 发 生 ) 时 才 中 止 循环 。 


> 


无 连接 (如 SOCK_DGRAM) 


调用 recv 之 前 ， 套 接口 必须 是 已 绑 定 的 。 如 果 该 套 接口 调用 了 connect HA, MARA 
来 自 connect 函数 中 指定 的 远 端 地 址 的 报 文才 会 被 接受 。 如 果 recv 操作 时 ， 系 统 输入 队列 中 
的 待 读 取 数据 报 比 用户 缓 冲 区 大 ， 那 么 数据 报 的 前 面部 分 的 数据 将 被 读 至 用 户 缓冲 区 ， 超 出 
部 分 将 被 丢弃 , 同时 recv 操作 出 错 , 返回 错误 码 10040 (WSAEMSGSIZE - Message too long) o 
因此 ， 在 接收 UDP 报 文 时 ， 如 果 recv 返回 SOCKET_ERROR， 还 应 该 检查 具体 的 错误 码 ， 
WSAEMSGSIZE 或 许 是 应 用 程序 可 以 接受 的 。 

与 recv 函数 相对 应 ，send 函数 从 一 个 已 连接 套 接口 发 送 数据 。 函 数 定义 如 下 : 


int send(SOCKET s, const char FAR *buf, int len, int flags); 


a 


a 
a 
a 
a 


a 


s [IN]， 已 连接 套 接口 的 描述 字 ， 可 以 是 面向 连接 的 ， 也 可 以 是 无 连接 的 。 

buf: [IN]， 待 发 送 数据 的 缓冲 区 指针 。 

len: [IN]， 待 发 送 数据 的 字 节 数 。 

flags: [IN]， 操 作 标志 ， 可 置 为 0。 

返回 值 : 如 果 没 有 错误 发 生 , send 返回 成 功 发 送 的 字 节 数 , 对 于 非 阻塞 套 接口 来 说 ， 
该 值 可 能 小 于 len; 否则 ， 返 回 SOCKET ERROR. 

注释 : 该 函数 必须 用 于 已 连接 套 接口 。 对 于 数据 报 套 接口 ， 应 注意 待 发 送 的 报 文大 
小 的 上 限 问题 ， 如 果 send 的 报 文 过 大 ， 将 返回 WSAEMSGSIZE 错误 码 。 此 外 ,成 
功 的 send 操作 并 不 保证 数据 被 成 功 地 传递 给 了 目标 主机 , 这 个 问题 将 在 17.6.8 节 做 
TRAM. ALF, send 函数 应 用 于 流 套 接口 。 


17.6.8 
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recvfrom 和 sendto 


recvfrom/sendto 函数 类 似 于 recv/send， 一 般 情况 下 ， 前 者 应 用 于 数据 报 套 接口 ， 后 者 用 
于 流 套 接口 。 尽 管 没 有 理由 将 recvfrom/sendto 应 用 于 TCP， 但 确实 也 可 以 这 么 做 。 
recvfrom 的 函数 定义 如 下 : 


int 


recvfrom(SOCKET s, char FAR* buf, int len, int flags, 


struct sockaddr FAR *from, int FAR *fromlen 


); 


a 
a 
口 


参数 s、buf、len 和 flags 与 recv 完全 相同 。 

from: [OUT]， 用 于 保存 接收 到 的 数据 的 源 地 址 的 缓冲 区 指针 。 可 选 。 

fromlen: [INOUT], from, fromlen 两 个 参数 类 似 于 accept 函数 的 后 两 个 参数 。 在 调 

用 recvfrom 函数 之 前 ,应 该 将 由 fromlen 置 为 由 from 所 指 的 INET 地 址 结构 的 长 度 ; 

调用 完毕 后 ，fromrlen 返回 内 核 保存 该 地 址 的 所 用 存储 空间 的 精确 字 节 数 。 如 果 输 

入 的 fromlen 值 小 于 内 核 所 需 的 存储 空间 大 小 ， 那 么 函数 调用 将 返回 错误 10014 
(WSAEFAULT - Bad address)。 可 选 。 

BAA: 如 果 没 有 错误 发 生 ，recvfrom 返回 接收 的 字 节 数 ; 否则 返回 

SOCKET_ERROR。 需 要 注意 的 是 ， 返 回 结果 0 并 不 表明 有 错误 发 生 ， 通 常 来 说 这 

是 UDP 套 接口 读 到 了 一 个 纯 UDP 报 文 头 。 

注释 : recvfrom 与 recv 函数 的 差别 仅仅 是 前 者 在 获取 数据 的 同时 还 可 以 获得 该 数据 

的 源 地 址 。 如 果 将 recvfrom 的 后 两 个 参数 设置 为 空 指针 , 那么 它 就 等 价 于 recv 函数 。 

对 于 数据 报 套 接口 来 说 ， 每 个 UDP 套 接口 都 有 一 个 输入 缓冲 区 ， 到 达 的 报 文 都 进 

入 该 缓冲 区 保存 ， 当 进程 调用 recvfrom， 那 么 缓冲 区 中 的 报 文 就 会 以 FIFO 的 顺序 

返回 给 进程 。 


sendto 函数 定义 如 下 : 


int 


); 


口 
口 


sendto(SOCKET s, const char FAR *buf, int len, int flags, 
const struct sockaddr FAR *to, int tolen 


HH s. buf. len 和 flags 与 send 函数 参数 一 致 。 

to: [IN]， 指 向 目标 套 接口 地 址 的 指针 。 如 果 套 接口 是 已 连接 的 ， 那 么 该 指针 可 为 
空 。 可 选 。 

tolen: [IN]， 地 址 结构 to 的 大 小 。 

返回 值 : 如 果 没 有 错误 发 生 ，sendto 返回 成 功 发 送 的 数据 的 字 节 数 ， 该 值 可 能 比 len 
要 小 ;否则 返回 SOCKET ERROR. 

注释 : sendto 函数 通常 用 于 无 连接 套 接口 (如 UDP)， 向 指定 目标 地 址 发 送 数据 报 ; 
即使 该 套 接 口 已 经 调用 了 connect 函数 ,传送 该 报 文 的 目标 地 址 仍然 由 to 参数 决定 。 
对 于 一 个 面向 连接 的 套 接口 ， 参 数 to 和 tolen 将 被 忽略 ，sendto 等 价 于 send。 

示例 : 对 于 UDP 协议 来 说 ， 大 家 都 知道 成 功 地 调用 sendto 并 不 意味 着 数据 确实 被 
发 送 到 了 目标 地 址 ， 然 而 ， 事 实 上 甚至 不 能 据 此 推断 数据 确实 从 本 地 网 络 接口 发 送 
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BET. 
下 面 的 代码 向 同一 局 域 网 中 的 一 台 离线 主机 发 送 UDP 报 文 ， 根 据 网 络 监视 器 截获 的 报 
200) 文 可 发 现 ， 由 于 该 主机 并 不 在 线 ， 本 机 发 送 的 ARP 请 求 得 不 到 响应 ， 因 此 sendto 发 送 的 数 
据 报 无 法 组 装 成 链 路 层 的 数据 帧 ， 也 就 无 法 被 发 送出 本 地 网 络 接口 。 然 而 此 时 的 sendto 函数 
依然 给 出 了 正常 的 返回 值 。 

得 出 的 结论 是 : 成 功 的 sendto 调用 不 能 确保 数据 被 发 送出 ， 更 不 能 保证 成 功 地 到 达 目 标 
主机 。 如 下 


Ydoeeieeeeeeeeieeenieeieoeeoeeeeeex. 程序 了 。3 UDPSend to III IOI AI a Ia a ek 


#pragma comment (lib, "ws2 32.1ib") 


#include <STDIO.H> 
#include <WINSOCK2.H> 


#define OFFLINE HOST 7202.119.9.4" 
#define DATANUM 6 


void HandleError (char*) ; 


int main(int argc, char* argv[]) 

{ 
WSAData wsaData; 
WSAStartup (WINSOCK_VERSION, &wsaData) ; 
SOCKET sock = socket (AF_INET, SOCK_DGRAM, 0); 


struct sockaddr_in to; 

memset (&to, 0, sizeof(to)); 

to.sin addr.S un.S addr = inet addr(OFFLINE HOST); 
to.sin family - AF INET; 

to.sin port - htons(9999); 


char *buf - "Hello!"; 
int res = sendto (sock, buf, DATANUM, 0, (struct sockaddr *) &to, sizeof (to)); 
if(res == SOCKET ERROR)( 

HandleError ("sendto"); 


) 


else 
printf ("Send out $d bytes!\n", res); 


closesocket (sock) ; 
WSACleanup(); 
return 0; 


void HandleError(char *func) 
t 
int errCode - WSAGetLastError(); 
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char info[65] = {0}; 
_snprintf(info, 64, "%s: func, errCode) ; "m 
printf (info); 

} 


SIO III II TORII TO TIC ICICI TOIT TCI IO TIO TORTI TO IITA TO TOI TOA TA tek et ak 


输出 结果 是 “Send out 6 bytes!”， 但 事实 上 嗅 包 器 告诉 我 们 除了 没有 回应 的 ARP 请 求 
“Who has 202.119.9.4? Tell 202.119.9.199” (202.119.9.199 是 发 送 端 ) 外 ， 没 有 任何 的 UDP 
17.5 所 示 。 


0.000000 202.118. 9.49 202.119.9.235 Name query WE wORKGRQUPCID» 
"648199 922333c3.0007e0242ade 922333c3.FFFFFFFFFFFF IPX SAP General Response 
.010910 202,129. 9.127 202.119.9.255 BROWSER Local Master announcement SEU-E4DFSIWT5SS, workstation, ser 
011430 202.119. 0:126 202 NBNS Release MB WORKGEOUP«ld»- 

Release ND <01><02>_ MSORCWSE. 


NbNS 


5 Find nane DBGROUP<20> 
Soanming-trec-(fcr-br STP Conf. roct - 8192/00:00: 
84580 202.119. 255.255.255.255 OMcP DHCP Infcrm — - Transaction ID Oxo 
1716108 922333 (00000000. FFFFFFFFFFFF NBIPX Find nane DBGROUP<2| 

+253902 0.0.0.0 255.255.255.255 DHCP HCP Discover - Transaction I0 Ox7e27f 
1582748 922333c3.0007e99e4750 00000000.fFfFFFfffFff NBIPx Find nane DBGROUP<2D> 

1840636 922323c3.000106223c51 922333c3.fFfffffffFff IPX SAP General Response 

,841995 922333c3.000106223c51 922333c3.frffffTfffTf IPX SAP General Response 

1837011 200,119. ALL-ROUTERS.MCAST.NET IGMP V2 Leave Group 


1838498 C1scu_34 come Cisco Group wanagement Protocol 
“895088 cisco-3a comp ci Cisco Greup Management Protocol 
1034425 Spanning-tree-Cfor-br Conf. Root = 8192/00:09:7b:52:08:30 Cost = 18 Port = Ona’ 
20 5.424462 Cisco. Ce Cisco Group Management Protocol 
DENIS NRMTENEOSS coe Cineo cren wanaammenr ororacnl vj 
pu—————————————— 
GFrame 7 (42 bytes on wire, 42 bytes captured) R 
ethernet 13, Src: 00. n 7c, ffir r 
B address Resolution Protocol (request) 
Hardware type: ethernet (0x0001) 
protocol type: 1P (0x0800) 
Hardware sia 
Protocol siz 
Dpcada: request (0x0001) 
Sender MAC address: 00:02:55:93:0a:7¢ (phoenix) 
Sender IP acdress: phoenix (202.119, 9,199) E 
Targat MAC address: 00:00:00:00:C0:00 (00:00:60_00:00:00) 4 


F — 


[6605 ff ff tf fr ff ff 00 02 55 98 Da 7- 08 06 OD Cl 
loch 08 Q0 06 04 Q0 01 00 02 55 98 Da 7c ca 77 09 c7 
020 00 00 00 0D Q0 00 ca 77 09 04 


Fmer]T | Reset] acpy|[Fre. «capture» Drops:0 
17.5 sendto 的 问题 


发 送 一 个 0 字 节 的 数据 报 也 是 可 行 的 ， 它 将 使 得 一 个 不 带 任何 应 用 层 数 据 的 UDP 报 文 
头 被 发 送出 去 。 把 上 例 中 OFFLINE HOST 改 为 实际 上 在 线 的 主机 202.119.9.242， 把 
DATANUM 改 为 0， 并 在 202.119.9.242 上 运行 下 面 的 简单 接收 程序 : 


SOCKET sock = socket (AF_INET, SOCK_DGRAM, 0); 


struct sockaddr_in addr; 

int len = sizeof (addr); 

memset (&addr, 0, sizeof (addr) ); 
addr.sin_addr.s_ addr = INADDR_ANY; 
addr.sin_family = AF_INET; 
addr.sin port = htons (9999); 
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if(bind(sock, (struct sockaddr *) &addr, len) == SOCKET ERROR)T 
printf("bind: %d", WSAGetLastError()); 


memset (&addr, 0, sizeof (addr)); 


char buf[120] -(0); 
ret = recvfrom(sock, buf, 120, 0, (struct sockaddr *) &addr, &len); 


if( ret == SOCKET ERROR)( 

printf("recv: %d\n", WSAGetLastError()); 
H 
else 


printf("recv td bytes from %s!\n", ret, inet ntoa(addr.sin addr)); 


接收 端的 运行 结果 为 “recv 0 bytes from 202.119.9.199!”， 因 此 可 以 得 出 结论 : 发 送 0 
字 节 的 数据 报 是 可 以 的 ， 在 接收 端 ，recvfrom 返回 0 也 是 正常 的 现象 ， 并 不 说 明 对 方 已 关闭 
来 连接 ， 这 与 TCP 套 接 口上 recv 返回 0 不 同 。 如 图 17.6 所 示 。 


3 
who has 2 Tell 202.119.9.1 
Cisco Group Managenent Protocol 

E 


nse 
who has 202.119, 9.1927 Tell 202.119.9.1 
Mame query Ne woarcrour do 


panning- Conf. Root = 192/00:00: 7b 
PE seic33.Seu.edu.ch TCP 1047 > pops [SYN] seus 08573211 ackeo WInz6:33 Lene NSS: 
15 3.201771 seic33.seu.eduscn phoenix Tee leq-S54013151 Ack=2608573212 Win=56: 
16 2501708 nhnaniv Saicaa emi adu co Tce T EORR TEES EOS END 
Fr T zi 
Gram 3 (42 bytes on wire, 42 
因 Ethernar 11 02:55:08: i521 
lrterner Protocol, St Ador: hgzhat (202.119. 
Buser Datagram Protocol, sre Part: ) 9999 (9999) 
Source port: 1046 (1945) 
Destination port: aaa (9090) 
Length: 8 
checksum: Dx2cl1 (correct) 
[zr T 
Doce 00 05 29 SE Sa Zl 00 G2 35 98 Ua 7c 03 00 45 OO 
Dolo 00 Le % /b 00 00 NO 11 00 ae ca 77 03 c7 ca /7 


pore 09 FE oe de S? OF oo ce Se a 
Fier EE 
图 17.6 发 送 0 字 节 UDP 报 文 


Ee=n 


17.6.9 closesocket 
该 函数 关闭 一 个 存在 的 套 接口 。 函 数 定义 如 下 : 


int closesocket (SOCKET s); 


DO s [IN]， 待 关闭 的 套 接口 描述 字 。 
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O BA: 如 果 没 有 错误 发 生 ， 返 回 0; 否则 SOCKET ERROR. 
D $R: 该 函数 用 于 关闭 套 接口 并 释放 套 接口 描述 字 s， 调 用 该 函数 后 ， 任 意 对 s 的 
操作 都 将 引起 WSAENOTSOCK 的 发 生 。 


17.6.10 WSACleanup 


在 完成 了 所 有 的 套 接口 通信 及 函数 应 用 后 ， 就 可 以 调用 WSACleanup 来 终止 ws2_32.dll 
的 使 用 了 。 函 数 定义 如 下 : 


int WSACleanup (void); 


O ”返回 值 : 如 果 没 有 错误 发 生 ， 返 回 0， 否则 SOCKET ERROR. 

O 注释 : 进程 可 以 多 次 调用 WSAStartup 函数 ， 对 于 该 函数 的 每 一 次 成 功 调 用 ， 都 需 
要 有 一 次 WSACleanup 相对 应 。 只 有 最 后 的 WSACleanup 调用 才 会 进行 真正 的 结束 
处 理工 作 ， 其 他 都 只 是 将 Ws2 32.dll 的 内 部 计数 器 减 一 。 


17.7 简单 的 客户 端 程序 


在 本 章 开头 ， 我 们 说 过 客户 端 编程 与 服务 器 编程 相 比较 为 简单 ， 因 此 本 书 侧重 于 讨论 服 
务 器 的 设计 和 实现 。 但 是 ， 这 并 不 是 说 客户 端 不 重要 ， 为 了 让 读者 对 客户 端的 工作 机 制 有 一 
定 的 了 解 ， 并 且 能 熟练 掌握 上 文中 给 出 的 Winsock API， 本 节 专 门 对 客户 端 编 程 进 行 讨论 。 

对 于 客户 端 和 服务 器 的 区 别 将 在 第 18 章 作 详细 分 析 ， 目 前 读者 只 需要 知道 :发 起 通信 
连接 的 称 为 客户 端 ， 而 等 待 呼叫 请 求 的 称 为 服务 器 ， 并 且 对 于 17.5.1 节 讨论 的 3 种 套 接口 来 
说 ， 服 务 器 /客户 端的 概念 通常 都 是 针对 UDP 或 者 TCP 套 接口 而 言 的 。 


17.7.1 UDP 客户 端 


事实 上 ， 在 17.6.8 节 讨 论 recvfrom 和 sendto 函数 时 给 出 的 例子 就 是 UDP 客户 端 。 一 般 
来 说 ，UDP 服务 器 必须 绑 定 本 地 端口 ， 然 后 接收 外 来 的 UDP 报 文 并 向 客户 端 反 馈 数据 ;而 
客户 端 只 需要 创建 一 个 UDP 套 接口 ,向 服务 器 的 知名 端口 发 送 UDP 报 文 , 然后 调用 recvfrom 
函数 接收 反馈 即 可 。 读 者 可 以 很 方便 地 将 程序 17.3 改写 为 UDP 客户 端 程 序 ， 这 里 就 不 再 给 
出 示例 。 


17.7.2 TCP 客户 端 


通常 ，TCP 服务 器 的 设计 都 非常 复杂 ， 必 须 绑 定 本 地 的 特定 端口 ， 监 听 并 接受 外 来 的 连 
接 请 求 ， 然 后 再 进行 数据 交互 ， 并且 TCP 服务 器 通常 都 需要 能 同时 处 理 多 个 并 发 的 客户 端 连 
接 。 相 比较 ，TCP 客户 端 就 显得 简单 得 多 ， 首 先 创建 一 个 TCP 套 接口 ， 然 后 调用 connect ER 
数 主 动 连接 服务 器 ， 这 时 就 可 以 使 用 send/recv 函数 进行 数据 交互 了 。 

下 面 给 出 一 个 简单 的 TCP 客户 端 程序 MyTelnet， 读 者 可 以 使 用 该 程序 连接 任意 TCP 服 
务 器 的 任意 端口 ， 在 命令 行 方式 下 输入 字符 串 并 回 车 后 ， 所 输入 的 数据 将 被 发 送 至 服务 器 ， 
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然后 客户 端 会 读 取 服 务 器 的 反馈 数据 并 将 其 显示 。 


Yxddoeeeeeeeeeeeeoeeeeeoeeeoe TI 17.4 MyTelnet 4) E OSE SSE 


1 


N 


#pragma comment (lib, "ws2_32.lib") 


#include <STDIO.H> 
#include <WINSOCK2.H> 


SOCKET g_sockClient = INVALID_SOCKET; 


void usage () 7 
BOOL WINAPI CtrlHandler(DWORD dwEvent) ; 


int main(int argc, char* argv[]) 
i 
unsigned long destAddr; 
int nPort; 
if (argc == 2){ 
destAddr = inet_addr(argv[1]); 
if (destAddr == INADDR_NONE) { 
usage (); 


return -1; 


if (argc == 3){ 

destAddr = inet_addr(argv[1]); 

if (destAddr == INADDR_NONE) { 
usage (); 
return -1; 

} 

nPort = atoi(argv[2]); 

if(nPort <= 0 || nPort > 65535) { 
usage ()7 


return -1; 


else( 
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usage (); 


return -1; 


if (!SetConsoleCtrlHandler(CtrlHandler, TRUE) ) { 


printf ("SetConsoleCtrlHandler: %d\n", GetLastError()); 


return -1; 


WSADATA wsaData; 
WSAStartup(WINSOCK VERSION, &wsaData); 


g sockClient = socket(AF INET, SOCK STREAM, 0); 
if(g sockClient == INVALID SOCKET)( 
WSACleanup(); 


return -1; 


struct sockaddr in to; 
memset(&to, 0, sizeof(to)); 
to.sin addr.s addr - destAddr; 
to.sin family - AF INET; 


to.sin port = htons (nPort); 


printf("connecting $s:$d...... ", inet ntoa(to.sin addr), nPort); 


if(connect(g sockClient, (struct sockaddr *) &to, 
SOCKET ERROR)( 
if(g sockClient !- INVALID SOCKET) 


closesocket(g sockClient); 


printf("Failed. (connect $d) Wn", WSAGetLastError()); 


WSACleanup(); 
return -1; 

) 

else 


printf ("Successfully.\nINPUT:\n") ; 


char bufa[83]; 
char bufb[1000]; 
fd_set readSet; 


struct timeval tv; 


sizeof (to) ) 
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66 int ret, len; 

67 

68 while (1) { 

69 memset (bufa, 0, 83); 

70 gets (bufa); 

71 len - strlen(bufa); 

72 if(len » 80) len - 80; 

43 bufa[len] = '\r'; 

74 bufa[len + 1] = '\n'; 

75 bufa[len + 2] = 0; 

76 ret = send(g_sockClient, bufa, strlen(bufa), 0); 
77 if (ret == SOCKET_ERROR) { 

78 printf ("send: %d\n", WSAGetLastError()) 

79 break; 

80 } 

81 FD ZERO(&readSet); 

82 FD SET(g sockClient, &readSet); 

83 tv.tv sec = 3; 

84 tv.tv usec - 0; 

85 ret - select(0, &readSet, NULL, NULL, &tv); 

86 

87 if(ret == SOCKET ERROR) {// CASE 1: select Error 
88 printf("select: %d\n", WSAGetLastError()) 
89 break; 

90 } 

91 if(ret == 0){// CASE 2: select Timeout 

92 printf ("Timeout, No Response From Server.\n"); 
93 break; 

94 } 

95 if(FD ISSET(g sockClient, &readSet))(// CASE 3: select OK 
96 memset(bufb, 0, 1000); 

97 ret = recv(g sockClient, bufb, 1000, 0); 

98 if(ret == SOCKET ERROR)( 

99 printf("recv: %d\n", WSAGetLastError()); 
100 break; 

101 } 

102 else 


103 printf("%s\n", bufb); 


104 


105 
106 
107 
108 
109 
110 
1j 


112 void 
123 q 
114 

115 } 


116 BOOL 
117 if 
118 
119 
120 
121 
122 
123 
124 
125 
126 
127 
128 
129 


130 
I3L } 
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) 

if(g sockClient != INVALID SOCKET) 
closesocket(g sockClient); 

WSACleanup(); 

printf ("Stopped. An"); 


return 0; 


usage() 


printf ("usage:\tmytelnet x.x.x.x port\t\t\t(0 < port < 65535) An") ; 


WINAPI CtrlHandler(DWORD dwEvent) 


switch (dwEvent) { 

case CTRL C EVENT: 

case CTRL LOGOFF EVENT: 

case CTRL SHUTDOWN EVENT: 

case CTRL CLOSE EVENT: 
printf("Stopping...... Xn") 2 
closesocket (g_sockClient) ; 
g_sockClient = INVALID SOCKET; 
break; 

default: 
return FALSE; 


return TRUE; 


FIR III TRI IRI SITIO IO IR TRIO TOTTI TR TOR TI TTI TO Ak EEEE] 


在 命令 行 方式 下 输入 命令 “MyTelnet 202.119.9.99 7”， 即 连接 202.119.9.99 的 TCP-ECHO 
服务 端口 。 程 序 输出 如 图 17.7 所 示 。 

该 程序 向 读者 演示 如 何 编写 一 个 简单 的 TCP 客户 端 程序 ， 以 及 TCP 客户 端的 基本 工作 
流程 。 大 部 分 函数 调用 在 前 面 都 已 经 学 过 ， 下 面 对 程 序 源 码 进行 简单 的 介绍 : 
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图 17.7 MyTelnet 程序 输出 


第 1 行 pragma 注释 ， 指 示 连 接 器 〈linker) 查找 并 使 用 ws2_32.lib 静态 库 。 如 果 不 使 用 
这 种 编码 方式 ， 那 么 也 可 以 选择 在 项 目 设置 的 Link 选项 中 加 入 ws2_32.lib， 如 图 17.8 所 示 。 


Settings For: |Win32 Release 了 | 
(a 


5. ] Source Files 
Z3 Header Files 
Gi Resource Files 
[8] ReadMc.t«t 


ax 


General | Debug | C/C++ Link | Resources | Bi Ç 


n 


Category: [General —— = Reset 


Output file name: 
[ReleaseMyTelnetexe 


Objectlibrary modules: 
[ws2_32.lib|kemel32.lib user32.lib gdi32.ib winspool.lib c 


F Generate debug info I Ignore all default libraries 
F Linkincrementally — [^ Generate mapfile 

I Enable profiling 

Project Options: 

[wsz 32.lib kemel32.lib user32.lib gdi3ZJib E| 


|winspool.lib comdlg32.lib advapi32.lib shell32.lib 
Ple32.lib oleautI2.lib uuid.lib odbe2tib odbecp32.b j 


OK Cancel 


图 17.8 ws2_ 32.lib 的 设置 


第 4 行 声 明了 套 接口 类 型 的 全 局 变量 g_sockClient。 

第 9—35 行 读 取 输入 参数 目标 IP 和 端口 ， 分 别 保存 在 destAddr 和 nPort 变量 中 。 

第 36 一 39 行 调用 SetConsoleCtrlHandler 函数 为 MyTelnet 设置 某 些 特殊 事件 的 响应 函数 ， 
这 些 特 殊 事 件 有 CTRL C EVENT. CTRL CLOSE EVENT 等 。 

第 40~41 行 调用 WSAStartup 函数 ， 初 始 化 winsock。 

第 42 一 46 行 创建 客户 端的 TCP 套 接口 g_sockClient。 

第 47—51 行 填充 INET 地 址 结构 tt， 即 设 定 所 需 连接 的 TCP 服务 器 的 IP 地 址 和 端口 。 

第 53 一 61 行 根据 地 址 tt， 连 接 TCP 服务 器 。 

第 68 一 105 行 循环 体 。 从 控制 台 读 取 用 户 输入 数据 ， 发 送 给 服务 器 ， 然 后 接收 服务 器 的 


反馈 并 打印 。 


O 69~75 行 从 控制 台 〈console) 输入 读 取 一 行 数据 ， 加 以 处 理 后 保存 在 


组 中 。 


D) 76-80 行 调用 send 函数 ， 将 用 户 输入 数据 bufa 发 送 给 服务 器 。 


O ”81 一 104 行 读 取 服 务 器 的 反馈 数据 并 


E bufa 字符 数 


将 其 在 控制 台 窗 口 输出 。 该 段 代码 使 用 了 select 
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函数 进行 超时 控制 ， 关 于 select 的 分 析 与 使 用 参见 182.1 节 的 程序 18.1。 

第 106—107 行 调用 closesocket 函数 关闭 客户 端 套 接口 g_sockClient。 

第 108 行 调用 WSACleanup 函数 ， 结 束 winsock 的 使 用 。 

第 116—129 行 控制 台 事件 的 响应 函数 。 如 果 MyTelent 接收 到 CTRL C EVENT. 
CTRL LOGOFF EVENT. CTRL SHUTDOWN EVENT 或 者 CTRL_ CLOSE EVENT 事件 ， 那 
么 关闭 客户 端 套 接口 g_sockClient (将 导致 主 程序 中 关于 g sockClient 的 winsock 函数 调用 出 
错 ， 从 而 退出 循环 ) ， 并 将 其 赋值 为 INVALID SOCKET. 

在 本 节 中 ， 我 们 借 MyTelnet 程序 复习 了 常用 的 winsock API 函数 的 使 用 ， 并 且 熟 悉 了 
TCP 客户 端的 工作 流程 和 机 制 ， 此 外 该 程序 也 为 从 第 18 章 起 介绍 的 服务 器 编程 提供 了 一 个 
简单 的 调试 工具 。 总 的 来 说 ， 客 户 端 相 对 于 服务 器 来 说 还 是 非常 简单 的 ， 读 者 将 会 很 快 发 现 
这 一 点 。 
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在 第 17 章 中 我 们 介绍 过 , 很 多 网 络 应 用 系统 采用 的 都 是 客户 一 服务 器 模型 , 简写 为 C/S 
模型 。 事实 上 , 这 种 应 用 架构 读者 应 该 非常 熟悉 , 例如 TE 浏览 器 和 Web 服务 器 之 间 、Foxmail 
和 邮件 服务 器 之 间 等 。 知 名 服务 器 与 客户 端 之 间 的 数据 交互 按照 一 定 的 公开 标准 进行 ， 从 
TCP/IP 体系 结构 来 说 属于 应 用 层 协 议 。 Ak, 一 方面 , 我 们 用 同一 个 浏览 器 能 看 到 所 有 Web 
服务 器 上 的 页 面 ， 另 一 方面 ， 不 管 是 使 用 焉 ， 还 是 Netscape 浏览 器 ， 都 能 打开 同一 个 Web 
服务 器 上 的 网 页 。 与 之 相 比 较 , 我 们 自己 开发 的 客户 /服务 器 的 差别 仅仅 在 于 采用 的 是 私有 的 
应 用 协议 而 不 是 公开 标准 ， 在 结构 上 两 者 完全 相同 。 


18.1 基本 模型 


18.1 展示 了 最 简单 的 客户 一 服务 器 模型 ,服务 器 从 客户 端 接收 请 求 , 经 过 请 求 处 理 后 
向 客户 端 返回 应 答 。 如 何 区 分 客户 和 服务 器 ， 首 先 要 明确 的 是 客户 一 服务 器 都 是 软件 ， 是 运 
行 在 各 种 系统 下 的 程序 ， 而 不 是 硬件 ， 两 者 区 分 的 主要 依据 是 谁 发 起 了 通信 连接 请 求 ， 一 般 
来 说 ， 发 起 通信 连接 的 称 为 客户 端 ， 而 等 待 呼叫 请 求 的 称 为 服务 器 。 


图 18.1 客户 一 服务 器 模型 


18.1.1 面向 连接 与 无 连接 


服务 器 与 客户 端 之 间 的 数据 通信 是 由 底层 的 计算 机 网 络 通信 协议 TCP/IP 来 提供 的 ， 
TCP/IP 协议 族 为 应 用 层 服务 提供 了 两 种 传输 层 服务 : 面向 连接 的 TCP 协议 和 无 连接 的 UDP 
协议 。 因 此 ， 在 开发 自己 的 C/S 系统 时 ， 首 先 要 决定 的 就 是 选择 面向 连接 的 传输 协议 ， 还 是 
无 连接 的 传输 协议 。 

TCP 与 UDP 之 间 的 差别 是 很 明显 的 :UDP 是 一 种 非常 简单 的 传输 层 协议 ， 它 并 不 能 保 
证 数据 最 终 到 达 目 的 地 ; 与 此 相 比 ，TCP 提供 可 靠 的 传输 服务 ， 确 认 、 超 时 和 重 传 机 制 确保 
了 应 用 层 数据 会 被 可 靠 地 传送 到 目的 地 ， 同 时 TCP 还 提供 流量 控制 。 

采用 UDP 还 是 采用 TCP 并 没有 一 定 的 标准 ， 通 常 只 有 在 下 面 几 种 情况 下 采用 UDP 
协议 : 

CD C/S 之 间 的 数据 交互 非常 简单 ， 如 标准 服务 daytime 和 echo. 
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O) 与 数据 丢失 相 比 ， 系 统 更 不 能 容忍 超时 重 传 所 带 来 的 时 间 耗 费 ， 典 型 的 应 用 是 音 
视频 系统 。 

(3) 系统 架构 要 求 采用 组 播 或 者 广播 报 文 的 方式 。 

除 此 之 外 ， 如 果 要 在 系统 中 采用 UDP 协议 ， 那 么 就 必须 设计 良好 的 能 保证 数据 可 靠 传 
输 的 应 用 层 协议 ， 要 达到 这 个 目标 ， 确 认 、 超 时 重 传 和 流量 控制 或 许 都 是 必需 的 ， 而 这 正 是 
TCP 协议 所 提供 的 。 


18.1.2 ”并 发 和 迭代 


通常 情况 下 ， 服 务 器 需要 同时 向 多 个 客户 提供 服务 ， 而 客户 端 通常 只 与 一 个 服务 器 联 
系 (一 个 常见 的 例外 是 WEB 浏览 器 ) 。 我 们 把 能 同时 接受 多 个 客户 连接 的 服务 器 称 为 并 发 
服务 器 (Concurrent Server) ， 而 把 一 次 只 能 服务 一 个 客户 的 称 为 迭代 服务 器 (Iterative 
Server) 。 

迭代 服务 器 通常 用 于 提供 一 些 简单 的 服务 ， 如 daytime. echo 等 。 对 于 复杂 服务 的 提供 
来 说 ， 长 时 间 地 停顿 在 为 一 个 客户 的 服务 上 而 拒绝 其 他 客户 是 不 可 取 的 。 

通常 ， 和 迭代 服务 器 都 采用 面向 无 连接 的 UDP 协议， 而 并 发 服务 器 采用 TCP 协议 ， 当 然 
这 也 不 是 绝对 的 ， 在 第 20、21 章 将 加 以 深入 的 讨论 。 


18.2 Winsock I/O 模型 


为 了 开发 自己 的 客户 一 服务 器 系统 ， 必 须 先 了 解 Winsock 的 IO 模型 。 与 IO 模式 概念 
不 同 , IO 模型 讨论 的 是 在 软件 系统 层面 上 对 套 接口 上 的 IO 进行 管理 及 处 理 的 方式 。 常 用 的 
Winsock LO 模型 有 5 FH: select, WSAAsyncSelect, WSAEventSelect, ## IO WR VO 完 
成 端口 。 


18.2.1 1/0 复 用 一 select 


Windows 的 select 函数 由 Berkeley Sockets 继承 而 来 ， 当 调用 select 函数 时 ， 系 统 会 阻塞 
在 该 函数 上 直到 超时 或 者 预 设 定 的 某 个 IO 条 件 〈 如 套 接 口上 有 数据 可 读 ) 得 到 满足 ， 此 时 
可 以 进行 相应 的 IO 操作 〈 如 读数 据 ) 并 能 立即 得 到 结果 。 

18.2 演示 了 在 一 个 流 套 接口 上 直接 进行 阻塞 recv 操作 〈 左 ) 和 先 select 再 recv (H) 
的 流程 。 两 者 相 比 较 ， 采 用 select 事实 上 还 多 进行 了 一 次 函数 操作 ， 需 要 额外 的 开销 。 那 么 
为 什么 要 采用 select 模型 呢 ? 与 普通 的 阻塞 模式 相 比 ， 该 模型 的 优势 主要 体现 在 它 能 同时 判 
断 多 个 套 接口 〈 套 接口 集合 ，fda_set) 的 多 种 IO 状态 (read, write, exception) 。 一 次 成 功 
的 select 返回 ， 表 明 至 少 有 一 个 套 接 口 、 满 足 了 一 个 IO 状态 要 求 。 具 体 是 哪 一 些 套 接口 ， 
哪 一 些 VO 条 件 得 到 了 满足 需要 进行 检测 ， 这 也 是 称 select 为 VO 复 用 的 原因 。 

select 函数 定义 如 下 : 


int select(int nfds, 
fd_set FAR *readfds, fd_set FAR *writefds, fd_set FAR *exceptfds, 
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const struct timeval FAR *timeout 


) 7 


recv 阻 塞 至 select 等 待 有 
有 数据 可 读 数据 可 读 


recv 返回 recv 立即 返回 
图 18.2 select 的 使 用 


其 中 第 一 个 参数 nfds 属于 输入 参数 [IN], 在 伯克利 套 接 口 API 中 表示 被 测试 的 套 接 口 描 
述 字 的 个 数 ， 它 的 值 应 该 被 设置 为 需要 测试 的 最 大 描述 字 加 一 。 该 参数 在 Winsock 中 已 经 被 
忽略 ， 它 的 存在 仅仅 是 为 了 保持 兼容 性 。 

第 2 一 4 个 参数 readfds、writefds 和 exceptfds 均 是 描述 字 集 合 (fd set) 结构 指针 ， 属 于 
值 一 一 结果 〈 输 入 输出 ，[INOUT]) 类 型 参数 。 在 伯克利 套 接口 API 中 可 将 select 作 计时 器 
使 用 ， 在 Winsock 中 这 三 个 参数 不 能 同时 为 空 指针 ， 否 则 select 将 返回 10022 错误 码 

(WSAEINVAL - Invalid argument) 。 
fd set 结构 在 很 多 Winsock 函数 中 都 会 用 到 ， 该 结构 体 定义 如 下 : 


typedef struct fd set { 


u int fd count; // how many are SET? 
SOCKET fd array[FD SETSIZE]; // an array of SOCKETs 
) fd set; 


其 中 fd. count 表示 集合 中 套 接口 描述 字 的 个 数 ，fd_array 是 数组 形式 的 描述 字 集 合 。 我 
们 一 般 不 会 直接 对 fd. set 进行 操作 ， 套 接口 API 中 提供 了 一 整套 的 FD_XXX 宏 定 义 来 完成 
各 种 操作 任务 ， 这 些 宏 定义 如 下 : 

O FD ZERO(*set) 

该 宏 通 过 将 set 的 fd. count MBH 0 来 完成 对 该 fd_set 的 初始 化 。 

C FD SET(s, *set) 

将 套 接口 描述 字 s 加 入 集合 set。 

C) FD ISSET(s, *set) 

检查 套 接 字 s 是 否 在 set 中 ， 如 果 在 返回 非 0 值 ， 否 则 返回 0。 

口 FD_CLR(s, *set) 

从 集合 set 中 去 掉 套 接 字 s. 

第 5 个 参数 timeout 为 输入 参数 [IN]， 该 参数 以 TIMEVAL 结构 的 形式 告诉 select 函数 需 
要 等 待 的 时 间 。 其 中 ，tv_sec 字段 是 以 秒 为 单位 的 时 间 值 ，tv_usec 字段 是 以 毫秒 为 单位 的 时 
间 值 。 如 果 该 参数 值 设 为 NULL， 那 么 select 将 以 阻塞 模式 工作 ， 如 果 设 置 为 (0，0) ， 那 
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么 select 会 立即 返回 ， 由 此 可 以 对 套 接口 状态 进行 “ 轮 询 ”， 但 出 于 对 性 能 方面 的 考虑 ， 一 
般 不 会 这 么 做 。TIMEVAL 结构 定义 如 下 : 


struct timeval { 
long tv sec; // seconds 
long tv usec; // and microseconds 


E 


select 函数 返回 值 有 3 种 情况 。 
O SOCKET ERROR: 表明 select 函数 调用 出 错 ， 这 时 可 以 使 用 WSAGetLastError P 
数 来 获得 错误 码 。 
C) 0: 表明 select 等 待 超时 , 如 果 第 5 个 参数 为 NULL, 那么 不 会 出 现 该 返回 值 的 情况 。 
口 ” 其 余 均 为 正常 返回 , 说 明 下 列 情况 中 至 少 有 一 种 发 生 了 , 并 且 返 回 值 表 示 了 满足 IO 
操作 的 套 接 口 数 。 
(1) readfds 
C) 调用 了 listen 函数 ， 并 且 一 个 TCP 连接 正 等 待 接受 〈 三 步 握手 已 完成 )， 这 时 调用 
accept 将 成 功 。 
O ”有 数据 可 读 〈 包 括 带 外 数据 ， 如 果 开启 了 SO OOBINLINE 选项 )。 
O TOP 连接 被 关闭 、 复 位 或 者 中 止 。 
(2) writefds 
O ”数据 可 以 被 发 出 。 
O ”内核 正 处 理 一 个 非 阻塞 的 connect， 并 且 连 接 成 功 。 
(3) exceptfds 
口 ” 内 核 正 处 理 一 个 非 阻塞 的 connect， 但 是 连接 失败 。 
O ”有 带 外 数据 可 读 ， 但 是 未 开启 SO OOBINLINE 选项 。 
下 面 给 出 一 个 简单 的 例子 来 说 明 select 的 使 用 : 


doooooopoeopdonoaoaoeoeeeogaaaeeeeoeer RE 181 SelectModel *eeebooookoeorooooooolooroororaaoak 


#pragma comment (lib, "ws2 32.lib") 


#include <STDIO.H> 
#include «WINSOCK2.H» 


int main(int argc, char* argv[]) 

{ 

WSAData wsaData; 

WSAStartup(WINSOCK VERSION, &wsaData) ; 

// 创建 流 套 接口 sockListen 

SOCKET sockListen = socket (AF INET, SOCK STREAM, 0); 


// 将 sockListen 绑 定 到 本 地 IP 的 9999 端口 
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struct sockaddr_in addr; 

int len = sizeof (addr); 

memset (&addr, 0, sizeof (addr) ); 

addr.sin addr.s addr = INADDR ANY; 

addr.sin family = AF INET; 

addr.sin port - htons(9999); 

if(bind(sockListen, (struct sockaddr *) &addr, len) == SOCKET ERROR)( 
printf ("bind: %d\n", WSAGetLastError()); 
goto FINISH; 

} 

// sockListen 进入 监听 状态 

if(listen(sockListen, 1) == SOCKET ERROR)( 
printf("listen: %d\n", WSAGetLastError()); 
goto FINISH; 


SOCKET sockSvr; 
int ret; 
char buf[1200]; 
fd set readSet; 
timeval tv; 
memset(&tv, 0, sizeof(tv)); 
tv.tv sec - 8; 
while(1)( 
// 接受 连接 ， 返 回 sockSvr 
sockSvr = accept(sockListen, NULL, NULL); 
if(sockSvr == INVALID_SOCKET) 
break; 
// select 操作 
FD ZERO(&readSet); 
FD SET(sockSvr, &readSet); 
ret - select(0, &readSet, NULL, NULL, &tv); 
// CASE 1: select Error 
if(ret == SOCKET ERROR)( 
printf("select: %d\n", WSAGetLastError()); 
closesocket (sockSvr) ; 
break; 
} 
// CASE 2: select Timeout 
if (ret == 0){ 
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closesocket (sockSvr) ; 
continue; 
} 
// CASE 3: select OK 
if(FD ISSET(sockSvr, &readSet)) { 
memset (buf, 0, 1200); 
ret = recv(sockSvr, buf, 1200, 0); 
if (ret == SOCKET ERROR) { 
printf ("recv: %d\n", WSAGetLastError()); 
closesocket (sockSvr) 7 
continue; 
} 
send(sockSvr, buf, ret, 0); 


closesocket (sockSvr) ; 


} 


FINISH: 

closesocket (sockListen) ; 
WSACleanup(); 

return 0; 


) 


dokokokolokookololololokotolaloolokolololololoolololelolokololooolokoolololeloololololololoeloloololooolololololooloolooololo ooo EEEE EErEE EEEE 


seek 


在 上 面 的 代码 中 ， 首 先 创建 了 一 个 监听 本 地 9999 端口 的 TCP 套 接口 sockListen; 然后 
系统 阻塞 在 accept 函数 调用 上 直到 连接 到 来 并 返回 sockSvr: sockSvr 等 待 对方 发 送 数据 ， 并 
将 接收 到 的 数据 反射 回 对 方 套 接口 ， 如 果 在 8 秒 钟 内 无 数据 可 读 那 么 select 超时 返回 ， 最 后 
关闭 sockSvr， 程 序 循环 回 至 accept 阻塞 调用 。 

18.3 显示 了 采用 select 模型 的 基本 步骤 ， 总 结 如 下 : 

(D 使 用 FD_ZERO 宏 ， 将 感 兴趣 的 套 接 字 集合 fd_set 初始 化 。 
(2) 使 用 FD_SET 宏 ， 将 感 兴趣 的 套 接口 描述 字 分 配给 相应 的 fd. set. 
(3) 调用 select 函数 〈 一 般 设置 超时 时 间 ) ， 如 果 : 

O “返回 SOKCET ERROR， 进 行 相应 的 错误 处 理 。 

C) 返回 0， 表 示 select 超时， 根据 系统 设计 要 求 ， 可 关闭 套 接口 、 切 断 连接 或 者 返回 

步骤 (1)， 重 新 进行 select 的 相关 调用 。 

O ”正常 返回 N， 说 明 有 N 个 待 处 理 套 接口 描述 字 存在 ， 进 入 步骤 (D. 

(4) 使 用 FD_ISSET， 判 断 哪些 套 接口 有 什么 样 的 待 处 理 IO 操作 。 对 FD_ISSET 宏 操 
作 返 回 非 0 值 的 套 接口 进行 相应 的 UO 操作 。 全 部 处 理 完毕 后 ， 根 据 需 要 ， 返 回 步骤 (1) E 
新 进行 select 的 相关 调用 或 者 退出 。 
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FD_ZERO *— — 74 


SOCKET ERROR 


图 18.3 select 模型 的 应 用 过 程 


18.2.2 ”消息 机 制 一 一 WSAAsyncSelect 


WSAAsyncSelect 提供 了 一 种 基于 Windows 消息 机 制 的 异步 IO 模型 ， 使 用 该 函数 可 以 
为 特定 套 接口 上 特定 网 络 事件 的 发 生 指 定 系统 通知 消息 。 函 数 定义 如 下 : 


int WSAAsyncSelect (SOCKET s, HWND hWnd, unsigned int wMsg, long lEvent); 


全 部 参数 均 为 输入 参数 。 其 中 第 一 个 参数 s 是 WSAAsyncSelect 函数 操作 的 套 接口 描述 
字 ， 成 功 的 调用 WSAAsyncSelect 会 将 s 自动 设置 为 非 阻塞 模式 。 

第 四 个 参数 IEvent 用 于 设 定 用 户 所 关心 的 套 接口 s 上 的 网 络 事件 。WSAAsyncSelect 支 
持 的 网 络 事件 及 其 触发 条 件 如 表 18.1 所 示 。1Event 可 由 下 列 事件 值 通过 位 或 (|) 而 来 ， 举 一 
个 简单 的 例子 ， 如 果 关 心 套 接口 上 的 数据 可 读 和 关闭 事件 ， 那 么 就 有 : IEvent = FD READ | 
FD_CLOSE。 


表 18.1 网 络 UO 事 件 
事 件 值 & x 触发 条 件 
* 调用 WSAAsyncSelect 时 已 有 数据 可 读 
* 有 数据 到 来 ， 并 且 FD_ READ 消息 未 发 送 ” 
* recv 或 者 recvfrom 后 仍 有 数据 可 读 


希望 得 到 套 接口 有 数据 
可 读 的 消息 通知 


”如 果 发 送 过 FD READ 消息 , 那么 只 有 调用 下 文中 将 要 提 到 的 重新 激活 函数 后 才能 再 次 触发 FD_READ 消 
息 的 发 送 ， 这 属于 FD_READ 的 第 三 种 触发 条 件 。 
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续 表 
事 件 值 & X 触发 条 件 
* 调用 WSAAsyncSelect 时 ， 可 进行 send 或 sendto 操作 
» 、| 。 在 connect 或 者 accept 调用 后 ， 建 立 了 连接 
FD_WRITE pep E mR, 上 次 的 send 或 者 sendto 操作 因 WSAEWOULDBLOCK 失 
败 ， 目 前 可 能 会 成 功 
。 在 非 连接 套 接口 上 调用 了 bind 
。 当 调 用 WSAAsyncSelect 时 已 有 带 外 数据 可 读 
FD ooB eh 外 | ， 带 外 数据 到 来 ， 并 且 FD_OOB 消息 未 发 送 
* recv 或 recvfrom 后 ， 仍 然 有 带 外 数据 可 读 
pene * 调用 WSAAsyncSelect 时 已 有 外 来 连接 等 待 接受 
FD_ACCEPT | : in ^s Wie 有 连接 请 求 到 来 ， 并 且 未 发 送 FD_ACCEPT 消息 
= * 调用 了 accept 函数 后 ， 又 有 连接 请 求 到 来 
+ 调用 WSAAsyncSelect 时 正好 有 连接 完成 
。 调用 connect 后 ， 当 连接 建立 时 
m " + 调用 WSAloinLeaf 后 ， 当 join 操作 成 功 时 
— girato - 在 非 阻塞 、 面 向 连接 的 套 接口 调用 WSAConnect 或 者 
a is ^ '|  WsAloinLeaf 时 返回 WSAEWOULDBLOCK 错误 ， 但 是 
事实 上 此 时 网 络 操作 依然 在 进行 着 。 无 论 操作 最 终 是 失败 
还 是 成 功 ， 只 要 结果 能 确定 FD_CONNECT 消息 均 会 被 触 
发 
* 调用 WSAAsyncSelect 时 ， 套 接口 连接 被 关闭 
。 对 方 套 接口 正常 关闭 ， 并 且 没 有 数据 待 接收 〈 和 否则 会 等 
PXGROSE 至 所 有 数据 处 理 完毕 》 
c 仅 适 用 面向 连 希望 得 到 套 接口 关闭 的 | 。 本 地 套 接口 调用 shutdown (不 是 closesocket) 主动 关闭 ， 
消息 通知 对 方 通知 数据 发 送 完 毕 (如 TCP-FIN) ， 并 且 没 有 数据 待 
接 套 接口 接收 
。 对 方 中 断 连接 (如 发 送 了 TCP-RST) ， 并 且 lParam 包含 
WSAECONNRESET 错误 值 
FD QOS 希望 得 到 套 接口 QOS AK] 。 当 WSAAsyncSelect 调用 时 ， 套 接口 QOS 发 生 了 变化 
= 态 发 生变 化 的 消息 通知 | 。 调用 WSAloctl (SIO GET QOS) 改变 了 套 接口 QOS 
FD_GROUP_QOS | 保留 保留 
iu a a 调用 WSAIoctl (SIO ROUTING INTERFACE CHANGE) , 
i s | 本 地 到 达 指定 目标 的 网 络 接口 发 生 了 变化 
CHANGE 通知 
FD ADDRESS LI 机 调用 WSAIoctl (SIO ADDRESS LIST CHANGE) ， 用 户 进 
ST_CHANGE 改变 的 通知 程 可 绑 定 的 本 地 地 址 列表 发 生 了 变化 


第 三 个 参数 wMsg 是 用 户 为 套 接口 网 络 事件 IEvent 设 定 的 通知 消息 , 通常 wMsg 指定 一 
个 用 户 定义 的 消息 CWM_USER +n) ， 例 如 : 


#define WM_USER_SERVER 


WM_USER+1 
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第 二 个 参数 hWnd 是 用 户 指定 的 接收 系统 通知 消息 wMsg 的 窗 体 句柄 。 
如 果 函 数 调用 成 功 ，WSAAsyncSelect 返回 0; 否则 返回 SOCKET ERROR, 这 时 可 以 调 
Qus) 用 WSAGetLastError 来 获得 具体 的 错误 码 。 在 成 功 调用 WSAAsyncSelect 后 ， 当 有 特定 网 络 
事件 发 生 时 ， 我 们 指定 的 窗 体 就 会 收 到 指定 的 用 户 消息 。 当 然 ， 系 统 并 不 会 为 该 网 络 事件 连 
续 不 断 地 向 用 户 进程 发 送 通知 。 事 实 上 ， 在 成 功 地 发 送 了 一 次 消息 后 ， 消 息 通知 机 制 会 暂停 
工作 直到 用 户 进程 调用 了 特定 的 Winsock 的 VO 处 理 函 数 ， 这 些 函 数 一 方 面 对 网 络 事件 进行 
相应 的 VO 处 理 ， 另 一 方面 会 重新 激活 (re-enable) 消息 通知 机 制 。 网 络 事件 与 其 对 应 的 重 


新 激活 函数 如 表 18.2 所 示 。 
表 18.2 网络 事件 与 重新 激活 函数 

网 络 事件 Re-enabling 函数 
FD READ recv, recvfrom, WSARecv 或 WSARecvFrom 
FD WRITE send, sendto, WSASend £k WSASendTo 
FD_OOB recv, recvfrom, WSARecv 或 WSARecvFrom 
FD ACCEPT accept BR WSAAccept (错误 码 不 能 为 WSATRY AGAIN) 
FD CONNECT x 
FD CLOSE 无 
FD QOS WSAIoctl (SIO GET QOS) 
FD GROUP QOS Reserved 
FD ROUTING INTERFACE CHANGE WSAIoctl (SIO ROUTING INTERFACE CHANGE) 
FD ADDRESS LIST CHANGE WSAIoctl (SIO ADDRESS LIST CHANGE) 


举 一 个 简单 的 例子 来 说 明 这 种 重新 激活 的 概念 ， 假 设 协议 缓冲 区 中 有 1000 个 字 节 的 数 
HE, 那么 系统 会 发 送 FD_READ 事件 相对 应 的 某 个 用 户 消息 (假设 为 WM_READ) 到 指定 的 
窗 体 ， 在 “发 送 了 WM_READ 消息 ”至 “用 户 进 程 调用 recv 函数 读 取 数据 ”的 这 段 时 间 内 ， 
系统 不 会 再 次 为 该 套 接口 上 的 该 网 络 事件 发 送 消息 。 只 有 当 调 用 了 recv 函数 后 ,该 网 络 事件 
的 消息 通知 机 制 才 会 被 再 次 激活 。 

同样 以 上 面 的 情况 为 例 , 假如 调用 recv 函数 只 读 取 了 500 个 字 节 的 数据 ， 这 时 缓冲 区 里 
还 有 500 字 节 待 读 ， 那 么 系统 会 怎么 样 ， 用 户 进程 又 该 怎么 处 理 呢 ? 这 就 涉及 到 事件 触发 的 
两 种 机 制 : 水 平 触发 (Level-Triggered) 和 边缘 触发 (Edge-Triggered) . FD READ. FD OOB 
AI FD ACCEPT 事件 的 消息 发 送 均 是 水 平 触发 的 ， 这 就 意味 着 如 果 重 新 激活 函数 (如 recv) 
被 调用 后 引起 消息 发 送 的 条 件 仍然 满足 〈 缓 冲 区 里 还 有 500 字 节 数据 ) ， 那 么 系统 会 再 次 发 
送 通知 消息 。 因 此 我 们 的 程序 可 以 是 事件 驱动 的 ， 而 不 用 管 操作 时 到 底 该 读 多 少数 据 〈 不 必 
一 次 读 完 ， 代 码 例子 可 见 下 一 节 ) 。 边 缘 触发 的 有 FD_QOS. FD GROUP QOS 等 ， 由 于 本 
书 不 涉及 ， 这 里 就 不 再 进行 讨论 。 

对 同一 套 接口 多 次 调用 WSAAsyncSelect 函数 , 那么 只 有 最 后 一 次 调用 的 设置 会 生效 (在 
此 之 前 的 所 有 WSAAsyncSelect 和 WSAEventSelect 的 设置 均 失效 ，WSAEventSelect 函数 将 
在 下 一 节 介绍 ) ， 因 此 : 


WSAAsyncSelect (s, m hWnd, WM USER SERVER, FD READ), ， 加 上 
WSAAsyncSelect(s, m hWnd, WM USER SERVER, FD CLOSE) 并 不 等 于 
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WSAAsyncSelect(s, m hWnd, WM USER SERVER, FD READ | FD CLOSE) 


如 果 要 取消 套 接 口 s 上 VO 事件 的 消息 通知 ， 可 以 进行 如 下 的 函数 调用 : e 
WSAAsyncSelect(s, hWnd, 0, 0) 


在 使 用 WSAAsyncSelect 函 数 设 定 了 套 接口 s 上 的 网 络 事件 (如 :RD_ READ |FD CLOSE) 
及 其 相应 的 Windows 消息 (如 : WM_USER_SERVER) 之 后 ， 我 们 就 需要 进行 消息 处 理 了 。 
以 MFC 编程 环境 为 例 ， 首 先 设 定 该 消息 的 处 理 函 数 ， 见 斜体 部 分 : 


BEGIN MESSAGE MAP(CXXXDlg, CDialog) 
//((AFX MSG MAP (CXXXD1g) 
//) )AFX MSG MAP 
ON MESSAGE(WM USER SERVER, OnServerMsg) 


END MESSAGE MAP() 


消息 处 理 函数 声明 为 : 


afx msg void OnServerMsg(WPARAM wParam, LPARAM lParam); 
它 的 定义 为 : 


void CXXXD1g::OnServerMsg (WPARAM wParam, LPARAM lParam) 
{ 
SOKCET sock = (SOCKET) wParam; 
if (WSAGETSELECTERROR (lParam) ) { 
ErrorProcess(); 
return; 


) 


switch (WSAGETSELECTEVENT (1Param) ) { 

case FD READ: 
ReadData (sock); // 读 数据 并 进行 相应 处 理 
break; 

case FD CLOSE: 
Finsish (sock); // 套 接口 关闭 工作 
break; 

default: 
break; 

} 

H 


消息 处 理 函数 会 接收 到 系统 传 来 的 两 个 输入 参数 wParam 和 lParam。 其 中 wParam 参数 
指明 了 发 生 网 络 事件 的 套 接口 ， 如 果 为 多 个 套 接口 (通常 是 服务 器 端 由 多 次 accept 返回 的 多 
个 已 连接 套 接口 指定 了 同一 个 用 户 消 息 ， 那 么 就 需要 根据 wParam 来 判断 到 底 是 哪 一 个 套 
接口 待 处 理 。 在 Param 参数 中 包含 了 两 方面 的 信息 : lParam 的 低 字 指 定 了 发 生 的 网 络 事件 ; 
lParam 的 高 字 包 含 了 可 能 出 现 的 错误 代码 。 在 上 面 的 OnServerMsg 函数 里 用 到 了 两 个 新 的 宏 
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定义 ，WSAGETSELECTERROR 和 WSAGETSELECTEVENT。 事 实 上 ， 它 们 的 作用 就 是 取 
高 / 低 字 ， 在 Winsock2.h 中 的 定义 如 下 。 考 虑 到 今后 可 能 的 变化 和 程序 的 兼容 性 ， 我 们 建议 
采用 宏 操 作 。 


#define WSAGETSELECTERROR (lParam) HIWORD (lParam) 
#define WSAGETSELECTEVENT (lParam) LOWORD (lParam) 


对 于 FD_WRITE 事件 的 处 理 ， 需 要 强调 的 是 当 用 户 进程 收 到 第 一 个 FD_WRITE 用 户 消 
息 后 就 应 该 认为 自己 能 向 套 接口 写 数据 ， 直 到 发 送 操作 碰 到 WSAEWOULDBLOCK 错误 时 
才 需 要 等 待 下 一 次 FD_WRITE 通知 消息 。 一 般 情况 下 ， 不 需要 考虑 套 接口 是 否 可 写 的 问题 ， 
也 就 不 用 关心 FD_WRITE 事件 。 

最 后 ， 我 们 总 结 一 下 WSAAsyncSelect 模型 在 MFC 环境 下 的 使 用 流程 : 

(1) 使 用 #define 语句 定义 为 套 接口 网 络 事件 设置 的 用 户 消息 值 ， 一 般 为 WM_USER+ 
N 形式 。 

(2) 调用 WSAAsynsSelect 函数 ， 为 套 接口 设 定 “网 络 事件 一 用 户 消息 一 消息 接收 窗 
体 ” 的 对 应 关系 。 

G) 在 消息 接收 窗 体 的 代码 的 消息 映射 模块 中 ， 加 入 ON. MESSAGE 宏 ， 设 定 用 户 消 
息 的 处 理 函数 。 

(4) 编写 用 户 处 理 函数 ， 该 函数 应 该 首先 使 用 WSAGETSELECTERROR EFM EAA 
错误 发 生 ， 然 后 根据 wParam 值 了 解 是 哪 一 个 套 接口 上 发 生 了 网 络 事件 从 而 引起 该 用 户 消 息 
被 系统 发 送 ， 最 后 使 用 WSAGETSELECTEVENT 宏 来 了 解 所 发 生 的 网 络 事 件 ， 从 而 进行 相 
应 的 处 理 。 


18.2.3 ”事件 机 制 一 WSAEventSelect 


WSAEventSelect 与 WSAAsyncSelect 模型 类 似 ， 同 样 是 系统 为 套 接口 上 的 网 络 事件 
FD XXX 向 用 户 进程 提供 通知 服务 。 当 收 到 通知 时 ， 进 程 就 可 以 进行 相应 的 IO 操作 并 立即 
返回 得 到 结果 。 两 者 的 差别 是 : 对 于 前 者 ， 系 统 发 送 事 件 对 象 通知 (Event-Object) ， 并 且 在 
内 部 的 网 络 事件 记录 中 加 以 记录 ; 对 于 后 者 , 系统 向 指定 窗 体 发 送 用 户 定义 的 Windows 消息 。 
其 函数 定义 如 下 : 


int WSAEventSelect (SOCKET s, WSAEVENT hEventObject, long lNetworkEvents); 


三 个 参数 均 为 输入 参数 。 其 中 第 一 个 参数 s 是 套 接口 描述 字 。 第 三 个 参数 INetworkEvents 
是 我 们 感 兴趣 的 套 接口 网 络 事件 ， 所 有 可 能 的 事件 值 以 及 值 的 组 合 均 与 WSAAsyncSelect R 
数 的 IEvent 参数 相同 。 如 果 该 值 设 为 0， 那么 将 取消 在 套 接口 s 上 的 所 有 网 络 事件 与 事件 句 
柄 之 间 的 联系 设 定 。 此 外 ， 无 论 该 值 是 否 为 0， 成 功 的 调用 WSAEventSelect 都 会 将 s 设置 为 
非 阻塞 模式 。 

第 二 个 参数 hEventObject 是 一 个 Winsock 的 事件 对 象 。 当 套 接口 s 上 发 生 了 lEvent 中 指 
定 的 网 络 事件 时 ， 系 统 会 发 送 hEventObject 并 将 其 记录 在 内 部 事件 记录 中 。 在 使 用 
WSAEventSelect 函数 之 前 ， 首 先 需要 创建 hEventObject。 关 于 Winsock 事件 对 象 的 三 个 基本 
操作 是 WSACreateEvent, WSAResetEvent 和 WSACloseEvent， 它 们 的 作用 分 别 是 创建 事件 
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对 象 、 复 位 事件 对 象 和 关闭 事件 对 象 。 函 数 定义 如 下 : 

O WSAEVENT WSACreateEvent (void) 

如 果 操 作成 功 ， 函 数 返回 新 创建 的 WSAEVENT 对 象 ， 否 则 返回 WSA INVALID 
_EVENT。 

O BOOL WSAResetEvent(WSAEVENT hEvent) 

事件 对 象 有 两 个 状态 : 已 触发 (signaled) 和 未 触发 (nonsignaled) 。 新 创建 的 事件 对 象 
为 未 触发 状态 ， 我 们 也 可 以 调用 WSAResetEvent 函数 来 将 已 触发 hEvent 事件 复位 为 未 触发 
状态 ， 如 果 操 作成 功 ， 函 数 返回 TRUE, AV) FALSE。 与 此 相对 应 ，Winsock2 还 提供 了 
WSASetEvent 函数 来 将 事件 对 象 设置 为 已 触发 状态 ， 本 书 不 涉及 该 函数 的 使 用 。 在 18.2.4 节 
介绍 重 又 操作 时 ， 会 发 现 很 多 Winsock? 函数 操作 会 自动 复位 特定 的 事件 对 象 。 

O BOOL WSACloseEvent(WSAEVENT hEvent); 

当 事 件 对 象 使 用 完毕 后 ， 需 要 调用 WSACloseEvent 将 它 关闭 ， 函 数 操作 成 功 则 返回 
TRUE， 否 则 返回 FALSE. 

成 功 地 调用 WSAEventSelect 函数 会 返回 0， 它 说 明 关 于 套 接口 s 上 的 “网 络 事件 一 事件 
对 象 ”关系 已 被 设 定 ， 并 且 内 部 网 络 事件 记录 也 已 被 清除 ， 否 则 返回 SOCKET ERROR. 
WSAEventSelect 也 存在 重新 激活 (re-enable) 和 水 平 触发 一 边缘 触发 的 概念 ，Winsock2 对 它 
和 WSAAsyncSelect 的 处 理 方式 是 完全 相同 的 ， 相 关 的 分 析 可 参照 18.2.2 节 。 

与 WSAASyncSelect 函数 一 样 ， 对 同一 个 套 接口 调用 多 次 WSAEventSelect 函数 ， 只 有 
最 后 一 次 设置 会 生效 ,此 前 无 论 是 WSAEventSelect 还 是 WSAASyncSelect 的 设 定 都 会 被 取消 。 
因此 ， 我 们 也 无 法 为 同一 个 套 接口 的 不 同 网 络 事件 设置 不 同 的 事件 对 象 。 举 例 来 说 ， 下 面 的 
代码 仅仅 起 到 了 为 套 接口 s HF] FD. WRITE 事件 设置 hEventObject2 对 象 的 作用 : 


ret = WSAEventSelect(s, hEventObjectl, FD READ); 
ret - WSAEventSelect(s, hEventObject2, FD WRITE); 


下 面 的 代码 取消 了 套 接口 上 任意 的 网 络 事件 与 事件 对 象 的 联系 设 定 ， 其 中 的 参数 
hEventObject 将 被 忽略 : 


ret = WSAEventSelect(s, hEventObject, 0); 


在 成 功 的 设 定 了 套 接 口上 的 网 络 事件 一 事件 对 象 的 联系 后 ， 可 以 调用 函数 
WSAWaitForMultipleEvents 来 等 待 或 者 轮 询 事件 对 象 的 状态 (是 否 已 触发 ) ， 并 且 可 以 使 用 
函数 WSAEnumNetworkEvents 以 获得 内 部 网 络 事件 记录 内 容 来 判断 到 底 是 哪 一 个 网 络 事件 
发 生 了 。 这 两 个 函数 的 定义 如 下 : 


DWORD WSAWaitForMultipleEvents ( 
DWORD cEvents, const WSAEVENT FAR *lphEvents, 
BOOL fWaitAll, DWORD dwTimeout, BOOL fAlertable 
Fi 


所 有 的 参数 都 是 输入 参数 。 其 中 lphEvents 是 网 络 事件 对 象 的 数组 指针 。cEvents 是 该 数 
组 中 的 事件 对 象 的 数目 ， 最 大 为 WSA MAXIMUM WAIT EVENTS， 至 少 为 一 。fWaitAll 
表示 等 待 的 类 型 , WRA TRUE, 函数 将 等 待 phEvents 数组 中 的 所 有 事件 对 象 的 状态 都 变 为 
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已 触发 ， 否 则 等 待 任意 事件 对 象 变 为 已 触发 。dwTimeonut 表示 等 待 的 超时 时 间 〈 以 微 秒 为 单 
位 ) ， 如 果 为 0， 函数 操作 将 立即 返回 ， 如果 为 WSA_INFINITE， 函 数 将 阻塞 直至 事件 对 象 
状态 满足 要 求 ， 当 函数 操作 超时 时 ， 无 论 fWaitAll 参数 条 件 是 否 已 满足 ， 函 数 均 会 返回 。 
fAlertable 用 于 设置 当 有 VO 完成 例 程 (completion routine ) 排队 等 待 执 行 时 ， 
WSAWaitForMultipleEvents 函数 是 否 需要 返回 ， 该 参数 的 使 用 在 本 书 中 不 涉及 ， 设 置 为 
FALSE。 

如 果 函 数 发 生 错 误 ， 返 回 WSA_WAIT_ FAILED， 否则 返回 以 下 几 种 结果 。 

(1) WSA WAIT EVENT 0 ~ WSA WAIT EVENT 0+ (cEvents-1) : 如 果 fWaitAll 
为 TRUE， 表 示 所 有 事件 对 象 均 已 触发 ， 否 则 返回 值 减 去 WSA WAIT EVENT 0 即 表示 事 
件 对 象 数组 中 的 已 被 触发 的 事件 对 象 的 数组 下 标 。 

(2) WAIT IO_COMPLETION: 一 个 或 多 个 VO 完成 例 程 已 排队 待 执行 。 

(3) WSA WAIT TIMEOUT: 函数 操作 超时 ，fWaitAll 参数 指定 的 事件 触发 要 求 未 得 
到 满足 。 


int WSAEnumNetworkEvents ( 
SOCKET s, 
WSAEVENT hEventObject, 
LPWSANETWORKEVENTS lpNetworkEvents 
) 7 


如 果 将 多 个 网 络 事件 (如 FD_READ | FD CLOSE) 与 同一 个 事件 对 象 联系 起 来 ， 那 么 
当 该 事件 对 象 被 触发 时 , 就 需要 使 用 WSAEnumNetworkEvents 函数 从 内 部 的 网 络 事件 记录 中 
找 出 到 底 是 哪 一 个 网 络 事件 触发 了 事件 对 象 。 这 相当 于 WSAAsyncSelect 模型 中 消息 处 理 函 
数 的 WSAGETSELECTEVENT(Param) 的 作用 。 

其 中 前 两 个 参数 为 输入 参数 ， 分 别 用 于 设 定 感 兴趣 的 套 接口 和 事件 对 象 。 第 三 个 参数 是 
输出 参数 ， 它 是 一 个 指向 WSANETWORKEVENTS 结构 体 的 指针 。 该 结构 定义 如 下 : 


typedef struct WSANETWORKEVENTS { 
long lNetworkEvents; 
int iErrorCode[FD MAX EVENTS]; 
) WSANETWORKEVENTS, *LPWSANETWORKEVENTS; 


它 包含 了 两 部 分 的 重要 信息 : INetworkEvents 表示 FD XXX 类 型 的 网 络 事件 值 ; 
iErrorCode 是 可 能 的 错误 码 的 数组 。 在 Winsock2.h 中 定义 了 很 多 类 似 于 FD_XXX_BIT 的 常 
量 值 (0 ~ FD MAX EVENTS-1) ， 例 如 : #define FD READ BIT 0 等 ， 其 中 常用 的 有 
FD READ BIT, FD WRITE BIT. FD ACCEPT BIT, FD CONNECT BIT, FD CLOSE BIT 
等 ， 可 以 直接 读 下 rrorCode[FD_XXX_BIT] 来 获取 可 能 的 套 接口 输入 错误 。 

WSAEnumNetworkEvents 如 果 没 有 错误 发 生 , 函数 返回 0; 否则 返回 SOCKET_ERROR。 

我 们 已 经 介绍 完了 WSAEventSelect 模型 涉及 到 的 大 部 分 操作 ， 下 面 提供 一 个 简单 的 例 
子 来 说 明 它 的 使 用 : 


üceeeeeeeeeeceeeeeeeeee PEE 18.2 WSAEventSelect Model **xeeeeeeeeeeeeeoeer 


i #pragma comment (lib, "ws2 32.1lib") 


N 


sone w 


wo 
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#include <STDIO.H> 
#include <WINSOCK2.H> 


int main(int argc, char* argv[]) 


{ 


WSAData wsaData; 
WSAStartup (WINSOCK_VERSION, &wsaData); 


SOCKET sockListen = socket (AF_INET, SOCK_STREAM, 0) 


struct sockaddr_in addr; 

int len = sizeof (addr); 

memset (&addr, 0, sizeof (addr) ); 
addr.sin addr.s addr = INADDR_ANY; 
addr.sin family = AF INET; 
addr.sin port = htons (9999); 


if(bind(sockListen, (struct sockaddr *) &addr, len) == SOCKET ERROR)( 


printf("bind: %d\n", WSAGetLastError()); 
closesocket (sockListen); 
WSACleanup () ; 


if(listen(sockListen, 1) == SOCKET_ERROR) { 
printf ("listen: %d\n", WSAGetLastError()); 
closesocket (sockListen) ; 
WSACleanup(); 


SOCKET sockSvr; 
int ret; 
char buf[1200]; 


WSAEVENT ev = WSACreateEvent (); // 创建 事件 对 象 
if(ev 一 WSA INVALID EVENT) { 


printf("WSACreateEvent: %d\n", WSAGetLastError()); 


closesocket (sockListen) ; 
WSACleanup () ; 

} 

WSANETWORKEVENTS evInfo; 


while (1) {// 主 循环 : 接受 连接 一 交互 一 断 开 连 接 一 接受 连接 . . . 


// 接受 和 连接， 返回 sockSvr 


sockSvr = accept(sockListen, NULL, NULL); 
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40 if(sockSvr == INVALID SOCKET) {// 直接 退出 主 循环 

41 printf("accept: %d\n", WSAGetLastError()); 

42 break; 

43 } 

44 // 设 定 关注 的 网 络 事件 和 事件 对 象 之 间 的 联系 

45 ret = WSAEventSelect (sockSvr, ev, FD READ | FD CLOSE); 

46 if (ret 一 SOCKET_ERROR) {// 直接 退出 主 循环 

47 printf ("WSAEventSelect: %d\n", WSAGetLastError()); 

48 closesocket (sockSvr) ; 

49 break; 

50 $ 

51 bool bClosed = false; 

52 while (!bClosed) {// 针对 每 个 连接 的 服务 循环 

53 // 将 ev 复位 为 未 触发 

54 WSAResetEvent (ev) ; 

55 

56 // 等 待 ev 触发 ， 超 时 设 为 8 秒 

57 ret = WSAWaitForMultipleEvents(1, &ev, false, 8000, FALSE); 

58 if (ret == WSA WAIT FAILED) {// Error， 退 出 服务 循环 

59 printf ("WSAWaitForMultipleEvents: %d\n", WSAGetLastError ()); 

60 bClosed = true; 

61 break; 

62 ) 

63 if(ret == WSA WAIT TIMEOUT) {// Timeout， 退 出 服务 循环 ， 主 动 关闭 连接 

64 bClosed = true; 

65 break; 

66 } 

67 if (ret != WSA WAIT EVENT 0) {// we set only one EvObj, so there must 
be error 

68 bClosed = true; 

69 break; 

70 à 

"1 // 获取 具体 的 网 络 事件 信息 

72 memset(&evInfo, 0, sizeof(evInfo)); 

73 ret =WSAEnumNetworkEvents (sockSvr, (&ev) [ret - WSA WAIT EVENT 0], 
&evInfo); 

74 if (ret == SOCKET ERROR) { 

75 printf ("WSAEnumNetworkEvents: %d\n", WSAGetLastError()); 

76 bClosed = true; 

TI break; 

78 } 


79 // 检查 是 否 有 错误 发 生 


80 


81 


82 
83 
84 
85 
86 
87 
88 
89 
90 
91 
92 
93 
94 
95 
96 
97 
98 
99 
100 
101 
102 
103 
104 
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if(evInfo.iErrorCode[FD READ BIT]!=0 || evInfo.iErrorCode[FD 
CLOSE BIT]!-0)[ 

printf("ErrorCode: $d", evInfo.iErrorCode[FD READ BIT] 一 0 ? 
evInfo.iErrorCode[FD CLOSE BIT] : evInfo.iErrorCode[FD READ 
_BIT]); 
bClosed = true; 
break; 

} 

// 如 果 没有 错误 发 生 ， 检 索 发 生 的 网 络 事件 

if (evInfo.1NetworkEvents & FD READ){// recv and echo 
memset (buf, 0, 1200); 
recv(sockSvr, buf, 1200, 0); 
printf ("recvd: %s\n", buf); 
send(sockSvr, buf, 1200, 0); 

} 

if((!bClosed) && (evInfo.lNetworkEvents & FD CLOSE)) {// 被 动 关闭 连接 
printf ("Peer closed! Wn"); 
bClosed - true; 

) 

)// 服务 循环 结束 
closesocket (sockSvr) ; 
}// 主 循环 结束 
WSACloseEvent (ev) ; 


closesocket (sockListen); 
WSACleanup(); 
return 0; 


} 
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5j 18.1 完全 相同 , 本 程序 实现 了 简单 的 Echo 服务 。 结 合 该 程序 , 我 们 对 WSAEventSelect 
模型 应 用 的 主要 流程 作 如 下 总 结 。 
(1) 调用 WSACreateEvent 函数 创建 一 组 Winsock 事件 对 象 (29—34 £7) 。 
(2) 调用 WSAEventSelect 函数 在 感 兴趣 的 套 接 口 〈 假 设 为 sockSvr， 可 能 有 多 个 ) 上 
建立 事件 对 象 与 网 络 事件 (假设 为 FD_READ |FD_CLOSE) 之 间 的 联系 (44 一 50 行 ) 。 
(3) 调用 WSAWaitForMultipleEvents 等 待 事 件 对 象 的 触发 ， 其 返回 值 一 般 有 3 种 情况 
(56—7011) 。 


a 
a 


a 


WSA WAIT FAILED， 函 数 调用 出 错 ， 进 行 相应 的 错误 处 理 。 

WSA WAIT TIMEOUT, 等 待 网 络 事件 超时 , 一 般 选 择 断 开 连 接 或 者 重新 开始 等 待 ， 
跳 至 步骤 (8)。 

正常 返回 值 。 当 调用 WSAWaitForMultipleEvents 时 的 参数 fWaitAll 为 false， 那 么 该 
返回 值 与 WSA WAIT EVENT 0 的 差 值 表示 被 触发 的 事件 对 象 在 数组 中 的 下 标 ; 
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如 果 fWaitAll 为 tue, 说 明 数 组 中 的 所 有 事件 均 已 触发 ; 针对 每 一 个 被 触发 事件 ( 假 
设 为 ev)， 进 入 步骤 (4)。 

(4) 将 WSANETWORKEVENTS 结构 体 〈 假 设 为 evInfo) 清 0， 然 后 以 sockSvr、ev 
以 及 &evInfo 为 参数 调用 函数 WSAEnumNetworkEvents， 以 获得 相应 的 网 络 事件 信息 ， 其 结 
果 保 存在 evInfo 中 (71—78 行 ) 。 

C5) 根据 evInfo 的 iErrorCode 域 判 断 是 否 有 特定 的 错误 发 生 〈79 一 84 行 ) 。 

C6) 将 evInfo 的 INetworkEvents 域 分 别 和 ED READ, FD CLOSE 相 比 〈&) ， 如 果 结 
果 不 为 0， 那 么 说 明 该 网 络 事件 发 生 了 (85~95 47) 。 

CD 对 发 生 的 网 络 事件 进行 相应 的 UO 处 理 。 值 得 注意 的 是 , 根据 18.2.2 节 中 对 于 水 平 
触发 的 分 析 ， 我 们 在 获知 FD READ 事件 后 只 需要 简单 地 调用 recv(sockSvr, buf, 1200, 0), 而 
不 需要 考虑 究竟 有 多 少数 据 可 读 ， 是 否 多 于 1200 字 节 。 

(8) 调用 WSAResetEvent 将 ev 复位 为 未 触发 (可 省 略 ) ; 回 至 步骤 (3) 。 
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HF COverlapped) IO 是 一 种 比较 复杂 的 VO 模型 ， 与 前 三 种 模型 都 围绕 某 个 特定 函数 
HE, HA IO 涉及 到 很 多 套 接口 IO 操作 函数 。 因 此 在 介绍 它 之 前 ， 首 先 对 这 些 函数 进行 
简单 的 描述 。 

在 第 17 章 中 介绍 了 基本 的 套 接口 IO 操作 函数 一 一 recv/send fil recvfrom/sendto, 事实 上 ， 
Winsock2 还 提供 了 一 组 对 应 的 以 WSA 起 头 的 函数 ，WSARecv/WSASend 和 WSARecvfrom 
/WSASendto。 除 了 函数 参数 的 区 别 之 外 ,它们 之 间 最 大 的 差别 就 在 于 后 者 提供 了 套 接口 上 的 
HS IO 操作 〈 还 有 两 点 重要 的 区 别 是 分 散 /聚合 类 型 的 IO 操作 和 lpFlags 参数 改 为 输入 输 
出 类 型 并 结合 以 MSG PARTIAL 标志 的 使 用 ， 这 些 都 不 是 本 书 关注 的 重点 ) 。 

首先 介绍 几 个 相关 的 数据 结构 : 


(1) typedef struct _ WSABUF ( 
u_long len; 
char FAR *buf; 

} WSABUF, FAR * LPWSABUF; 


与 recv/send 等 函数 直接 操作 char 指针 类 型 的 用 户 缓冲 区 不 同 ，WSARecv/WSASend 和 
WSARecvfrom/WSASendto 等 函数 操作 的 对 象 是 WSABUF 一 一 一 种 新 定义 的 用 户 缓冲 区 结 
构 。 其 中 len 表示 用 户 进程 提供 的 缓冲 区 的 大 小 , buf 是 指向 缓冲 区 的 指针 。 在 使 用 WSABUF 
之 前 , 必须 首先 为 buf 指针 分 配 空间 , 然后 将 该 缓冲 区 的 大 小 赋 给 len。 同 时, 在 调用 这 些 IO 
函数 时 ， 还 允许 指定 dwBufferCount 不 为 1， 即 能 同时 使 用 多 个 WSABUF 用 户 缓冲 区 ， 称 为 
分 散 /聚合 〈scattergather) IO 操作 。 


(2) typedef struct _WSAOVERLAPPED { 


DWORD Internal; 
DWORD InternalHigh; 
DWORD Offset; 


DWORD OffsetHigh; 
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WSAEVENT hEvent; 
} WSAOVERLAPPED, *LPWSAOVERLAPPED; 


WSAOVERLAPPED 是 从 Win32 的 OVERLAPPED 结构 移植 而 来 的 ， 与 后 者 完全 兼容 。 
它 向 用 户 提供 了 一 种 在 重 倒 IO 操作 的 初始 投递 和 UO 的 完成 之 间 进 行 联系 的 机 制 。 其 中 前 
四 个 参数 均 为 保留 域 , 由 系统 内 部 使 用 。 我 们 只 需要 将 hEvent 设置 为 特定 的 WSAEVENT 对 
象 即 可 。 


(3) typedef void (CALLBACK * LPWSAOVERLAPPED_COMPLETION_ROUTINE) ( 
DWORD dwError, 
DWORD cbTransferred, 
LPWSAOVERLAPPED lpOverlapped, 
DWORD dwFlags 
) 7 


LPWSAOVERLAPPED COMPLETION ROUTINE 是 Winsock2 rf 8 & UO 操作 的 回调 函 
数 指针 ， 当 VO 操作 完成 时 系统 会 自动 调用 由 该 指针 所 指向 的 完成 函数 。 四 个 参数 中 dwError 
表示 由 lpOverlapped 指定 的 重 释 操作 的 完成 状态 ;cbTransferred 表示 重 县 操作 过 程 中 传输 的 
字 节 数 ，lpOverlapped 参数 包含 调用 VO 操作 时 的 WSAOVERLAPPED 结构 信息 ; dwFlags 
参数 分 为 两 种 情况 , 对 于 WSARecv/WSARecvfrom 函数 来 说 ， 如 果 接 收 操作 能 立即 结束 那么 
dwFlags 包含 了 调用 接收 函数 时 的 IpFlags 参数 的 信息 , 对 于 WSASend/WSASendto 函数 来 说 
该 参数 暂 示 使用， 系统 会 设置 为 0。 

下 面 列 出 了 四 个 Winsock2 中 的 重合 VO 操作 函数 的 定义 : 


(1) int WSARecv( 
SOCKET s, 
LPWSABUF lpBuffers, 
DWORD dwBufferCount, 
LPDWORD lpNumberOfBytesRecvd, 
LPDWORD lpFlags, 
LPWSAOVERLAPPED lpOverlapped, 
LPWSAOVERLAPPED COMPLETION ROUTINE lpCompletionRoutine 

); 

(2) int WSASend ( 
SOCKET s, 
LPWSABUF lpBuffers, 
DWORD dwBufferCount, 
LPDWORD lpNumberOfBytesSent, 
DWORD dwFlags, 
LPWSAOVERLAPPED lpOverlapped, 
LPWSAOVERLAPPED COMPLETION ROUTINE lpCompletionRoutine 

); 

(3) int WSARecvFrom( 
SOCKET s, 
LPWSABUF lpBuffers, 
DWORD dwBufferCount, 
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LPDWORD lpNumberOfBytesRecvd, 

LPDWORD lpFlags, 

struct sockaddr FAR *lpFrom, 

LPINT lpFromlen, 

LPWSAOVERLAPPED lpOverlapped, 

LPWSAOVERLAPPED COMPLETION ROUTINE lpCompletionRoutine 
); 

(4) int WSASendTo ( 

SOCKET s, 

LPWSABUF lpBuffers, 

DWORD dwBufferCount, 

LPDWORD lpNumberOfBytesSent, 

DWORD dwFlags, 

const struct sockaddr FAR *lpTo, 

int iToLen, 

LPWSAOVERLAPPED lpOverlapped, 

LPWSAOVERLAPPED COMPLETION ROUTINE lpCompletionRoutine 
); 


这 组 函数 的 参数 、 返 回 值 以 及 系统 的 处 理 都 基本 相同 ， 下 面 统一 对 它们 进行 分 析 。 

要 进行 重合 IO 操作 ， 首 先 套 接口 s 必须 为 重 又 套 接 口 。 可 以 直接 调用 socket 函数 创建 
或 者 以 参数 dwFlags 为 WSA_FLAG_ OVERLAPPED 参数 调用 WSASocket。 下 面 两 行 代码 完 
成 了 同样 的 套 接口 创建 工作 。 


sock = WSASocket(AF INET, SOCK STREAM, 0, NULL, 0, WSA FLAG OVERLAPPED); 
Sock = socket(AF INET, SOCK STREAM, 0); 


按照 pOverlapped 和 IpCompletionRoutine 不 同 的 取 值 情况 ， 这 些 UO 函数 有 3 种 工作 

O “如果 IpOverlapped fil IpCompletionRoutine 均 设 为 NULL， 那么 系统 将 这 些 函 数 作为 
iB dEm 4 IO 操作 处 理 ， 其 表现 和 相应 的 发 送 、 接 收 函数 〈recv/send、 
recvfrom/sendto) 类 似 。 

C) “如果 仅 IpCompletionRoutine 为 NULL， 那 么 当 调用 这 些 VO 函数 时 IpOverlapped 结 
构 中 的 hEvent 事件 会 被 自动 复位 为 未 触发 , 当 重 县 VO 操作 完成 时 再 被 设置 为 已 触 
发 。 用 户 进程 可 以 调用 WSAWaitForMultipleEvents 或 者 WSAGetOverlappedResult 
来 等 待 或 者 轮 询 该 事件 对 象 的 状态 。 其 中 WSAWaitForMultipleEvents 函数 在 18.2.3 
节 已 经 介绍 过 ，WSAGetOverlappedResult 将 在 下 文 介绍 。 

口 ”、 如 果 IpCompletionRoutine 不 为 NULL， 那 么 hEvent 参数 将 被 忽略 ， 但 是 仍然 可 以 
被 用 来 向 完成 例 程 传递 信息 。 此 时 如 果 调 用 WSAGetOverlappedResult 应 注意 fWait 
参数 不 能 设置 为 TRUE。 

在 重 又 套 接口 上 进行 的 重生 数据 发 送 /接收 操作 将 工作 在 非 阻塞 模式 , 因此 函数 调用 能 立 

即 返回 ， 其 返回 值 可 分 为 3 种 情况 。 

O 返回 0, 说 明 IO 操作 已 立即 完成 并 且 无 错误 发 生 , 此 时 VO 完成 例 程 已 完成 调度 准 
备 执行 。 
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O 返回 SOCKET ERROR， 错误 码 为 997 (WSA IO PENDING), WHER IO 操作 
已 成 功 初始 化 ， 在 操作 完成 后 应 用 进程 会 得 到 系统 的 通知 。 
O 返回 SOCKET ERROR， 错误 码 不 是 WSA IO PENDING, 说 明 重合 VO 操作 初始 
化 失败 。 
在 完成 重 又 VO 函数 调用 后 , 可 以 调用 WSAGetOverlappedResult 函数 来 获取 指定 套 接口 
上 的 最 近 一 次 重 又 操作 的 结果 。 其 函数 定义 如 下 : 


BOOL WSAGetOverlappedResult ( 
SOCKET s, 
LPWSAOVERLAPPED lpOverlapped, 
LPDWORD lpcbTransfer, 
BOOL fWait, 
LPDWORD lpdwFlags 

); 


除了 lpdwFlags、lpcbTransfer 是 输出 参数 外 ， 其 余 均 为 输入 参数 。 其 中 s 是 感 兴趣 的 套 
接口 描述 字 ，lpOverlapped 用 于 返回 在 该 套 接口 上 进行 的 最 近 一 次 重 受 操作 时 的 
WSAOverlapped 结构 数据 ，lpcbTransfer 用 于 输出 重 又 操作 传输 的 字 节 数 ，lpdwFlags 用 于 输 
出 操作 的 参数 ，fWait 参数 指示 是 否 要 等 待 事件 对 象 lpOverlapped->hEvnet， 当 且 仅 当选 择 了 
基于 事件 的 完成 通知 ( 即 IpCompletionRoutine Jy NULL, lpOverlapped 不 为 NULL) HY, 才 
能 将 fWait 设置 为 TRUE。 如 果 无 错误 发 生 ，WSAGetOverlappedResult 返回 TRUE， 说 明 重 
登 操 作 已 成 功 完成 ; 否则 返回 FALSE, 说 明 或 者 重合 操作 没有 完成 , 或 者 重叠 操作 已 完成 但 
发 生 了 错误 ,或 者 WSAGetOverlappedResult 调用 时 有 参数 设置 错误 导致 重叠 操作 的 状态 无 法 
判断 。 

下 面 的 例子 说 明了 如 何 应 用 重 又 操作 的 事件 机 制 来 实现 一 个 简单 的 Echo 服务 器 。 


;Jeoeeoeeeoeeeoeeeeeeeoeeoee 程序 18.3 OverLappedl JX*4QX9441"VOOHOOKdood koi] 


T #pragma comment (lib, "ws2 32.lib") 


2 #include <STDIO.H> 

3 #include <WINSOCK2.H> 

4 int main(int argc, char* argv[]) 

NE: 

6 int ret; 

7 WSAData wsaData; 

8 WSAStartup(WINSOCK VERSION, &wsaData); 

9 

10 // lÆ WSA FLAG OVERLAPPED 属性 的 套 接口 

13 SOCKET sockListen = WSASocket(AF INET, SOCK STREAM, 0, NULL, 0, 
WSA FLAG OVERLAPPED); 

12 // 也 可 以 简单 地 调用 socket 函数 


13 //SOCKET sockListen = socket (AF_INET, SOCK_STREAM, 0); 
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struct sockaddr_in local; 

memset (&local, 0, sizeof(local)); 

local.sin_addr.s_addr = INADDR_ANY; 

local.sin_family = AF_INET; 

local.sin port = htons (9999); 

bind(sockListen, (struct sockaddr *) &local, sizeof(local)); 
listen(sockListen, 1); 


SOCKET sockSvr = accept(sockListen, NULL, NULL); 
closesocket (sockListen) ; 


// 创建 Winsock 事件 对 象 

WSAEVENT ev = WSACreateEvent () 7 
WSAOVERLAPPED ol; 
ZeroMemory(&ol, sizeof (ol)); 

// 我 们 仅 需 关心 hEvent 域 


ol.hEvent = ev; 


char buf[65]; 
WSABUF wsaBuf; 
unsigned long nRecved; 
DWORD flags; 
while (1) { 
memset (buf, 0, 65); 
wsaBuf.len = 65; 
wsaBuf.buf = buf; 
flags = 0; 
nRecved = 0; 
// 非 阻塞 调用 ， 将 socksvr. wsaBuf 和 ol 联系 起 来 ， 一 般 返 回 错 误 码 
WSA_IO_PENDING 
// 调用 时 ，ol 中 事件 对 象 会 被 自动 复位 
// 当 后 台 接收 数据 完成 ，wsaBuf 会 被 自动 填充 


if (WSARecv(sockSvr, &wsaBuf, 1, &nRecved, &flags, &ol, NULL) 


== SOCKET ERROR)( 
ret = WSAGetLastError(); 
if(ret != WSA IO PENDING) ( 
printf("WSARecv: $dMn", ret); 
break; 


} 
else if(nRecved == 0){// 对 方 关闭 了 连接 ! 
printf ("对 方 关闭 了 连接 !!!\n") ; 


break; 


53 


54 
55 


56 
57 
58 
59 
60 
61 
62 
63 
64 


65 
66 
67 
68 
69 
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} 


// 等 待 I/0 结束 ， 获 取 重 登 操 作 操作 结果 ， 判 断 该 I/O 是 否 成 功 
if(!WSAGetOverlappedResult(sockSvr, &ol, &nRecved, TRUE, 
&flags))( 

ret = WSAGetLastError(); 
printf("WSAGetOverlappedResult: %d\n", ret); 
break; 

} 

if (nRecved != O)( 
printf("%s\n", wsaBuf.buf) ; 
send(sockSvr, wsaBuf.buf, nRecved, 0); 

} 

}// while (1) 


WSACloseEvent (ev) ; 
closesocket (sockSvr); 
WSACleanup(); 

return 0; 


) 


FOI III ek eee ke ek eK eR ROO RR III ROO ROO KO ROC RH ROCK eR e KH KO eR eR eR ee 


第 10—13 行 创建 WSA FLAG OVERLAPPED 属性 的 TCP 套 接口 sockListen 。 
第 14 一 20 行 绑 定 本 地 端口 9999， 并 调用 listen 函数 使 sockListen 处 于 监听 状态 。 
第 21 一 22 行 在 sockListen 上 调用 accept 函数 , 返回 连接 套 接口 sockSvr 后 , 将 sockListen 


关闭 。 


第 24—29 行 调用 WSACreateEvent 函数 创建 Winsock 事件 对 象 ev， 并 将 其 赋值 给 重叠 
结构 ol 的 hEvent 域 。 
第 34 一 64 行 Echo 服务 循环 ， 在 sockSvr 上 进行 数据 的 收发 。 


口 


口 


口 


35~53 行 ， 投 递 WSARecv 8 & VO ff. HFRS VO 模型 中 ， 该 操作 为 非 阻 
塞 调用 ， 因 此 函数 一 般 都 会 返回 错误 码 WSA_IO_PENDING。 当 IO 完成 时 ， 接 收 
到 的 数据 会 被 系统 自动 填充 到 WSARecv 调用 时 指定 的 wsaBuf 缓存 中 。 需要 注意 的 
是 , 在 上 一 章 讨论 TCP 套 接口 recv 操作 时 提 到 ， 如 果 函 数 返回 0， 说 明 对 方 已 断 开 
JERR; 而 对 于 WSARecv 来 说 ， 由 于 WSARecv 函数 返回 0 表示 操作 成 功 ， 因 此 必 
须 特别 注意 该 函数 的 lpNumberOfBytesRecvd BA: 如 果 该 参数 值 为 0， 那 么 也 说 明 
对 方 关闭 了 连接 。 如 果 删 除了 第 一 个 程序 代码 中 对 nRecved—— 0 的 判断 ， 那 么 当 对 
方 关闭 连接 时 ，WSARecv 函数 会 返回 0、WSAGetOverlappedResult 返回 TRUE, 
而 会 陷入 死 循环 。 

54 一 59 行 ， 调 用 WSAGetOverlappedResult 函数 ， 等 待 套 接口 IO 结束 ， 并 获取 重 
RRRA R. 

60~63 行 , 在 本 地 显示 接收 到 的 数据 ,并 出 于 程序 简洁 性 的 考虑 直接 调用 非 重 又 /O 
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操作 的 send 函数 将 数据 反馈 Echo 给 客户 端 。 

第 65 行 调 用 WSACloseEvent 函数 关闭 事件 对 象 ev。 

第 66 行 关闭 服务 套 接口 sockSvr。 

第 67~68 行 结束 Winsock 的 使 用 后 退出 程序 。 

需要 指出 的 是 该 Echo 服务 器 每 次 运行 都 只 能 为 一 个 客户 端 服务 ， 当 该 客户 端 关闭 连接 
服务 器 即 终止 运行 ， 因 此 程序 18.3 仅 能 作为 演示 使 用 并 无 实际 价值 。 

在 下 面 的 例子 中 ， 将 演示 如 何 采 用 完成 例 程 机 制 实现 同样 的 服务 器 功能 。 由 于 我 们 希望 
在 主线 程 中 循环 调用 WSARecv， 而 在 完成 例 程 对 接收 到 的 数据 进行 处 理 ， 这 就 需要 一 些小 
的 技巧 一 一 在 完成 例 程 中 ， 程 序 只 能 接收 到 系统 传 来 的 lpOverlapped 参数 而 不 会 得 到 用 于 接 
收 数据 的 用 户 缓冲 区 结构 地 址 。 解 决 方法 是 将 重 又 结构 和 用 户 缓冲 区 结构 绑 定 在 一 起 ， 在 接 
收 到 该 重 琶 结构 地 址 后 作 简 单 的 运算 就 能 获取 用 户 缓冲 区 地 址 (当然 也 可 以 把 用 户 缓冲 区 结 
构 体 作为 全 局 变量 ， 但 这 种 方法 不 具有 扩展 性 ) 。 

最 简单 的 绑 定 方法 如 下 ， 此 时 当 得 到 ol 的 地 址 ， 也 就 得 到 了 OV Data 结构 体 的 起 始 地 
址 ， 因 此 在 完成 例 程 中 作 强 制 转化 即 可 得 到 OV_Data 地 址 。 


typedef struct OV Data( 

WSAOVERLAPPED ol; 

char buf [65]; 
}OV_Data; 


即 OV Data *povd = (OV Data *) lpOverlapped。 更 普遍 的 转换 公式 为 : 
OV Data *povd = (OV. Data *)(IpOverlapped — ol 在 结构 中 的 偏 移 量 ")。 
事实 上 ， 微 软 提供 的 宏 定义 CONTAINING RECORD 直接 提供 了 这 种 转换 的 功能 ， 有 : 


OV Data *povd = CONTAINING RECORD (lpOverlapped, OV Data, ol) 


CONTAINING RECORD 有 三 个 输入 参数 (address, type, field), 分 别 是 指 结构 实例 的 某 个 
域 的 地 址 ， 结 构 名 和 该 结构 域 的 域名 。 宏 的 输出 是 指向 结构 实例 的 指针 。 

另外 一 个 问题 , 前 面 曾 提 到 当 使 用 完成 例 程 机 制 时 , 重 又 结构 中 的 事件 对 象 是 被 忽略 的 ， 
那么 主线 程 如 何 知道 重 又 VO 已 完成 可 以 再 次 进行 WSARecv 操作 呢 ? 在 例子 中 采用 了 一 种 
较 简 单 的 方法 一 一 SleepEx 调用 。 该 函数 有 两 个 参数 ， 第 一 个 参数 dwMilliseconds 是 以 微 秒 
为 单位 的 休眠 (等 待 ) 时 间 , 第 二 个 参数 bAlertable 表示 是 否 设置 为 可 唤醒 的 , 如 果 为 TRUE, 
那么 当 有 VO 完成 例 程 发 生 ，SleepEx 将 提前 结束 并 返回 WAIT IO COMPLETION. 

下 面 是 采用 重 又 VO 模型 完成 例 程 机 制 的 Echo 服务 器 的 源 程序 ， 该 程序 与 18.3 差别 不 
大 ， 就 不 再 作 详 细 分 析 了 。 


dod eeeeeeeeeeeeeeoeeeeeeeee 程序 18 .4 OverLapped2 J X * 44434 4OOOOOOOOeeek 


#pragma comment (lib, "ws2 32.1lib") 


#include <STDIO.H> 
#include <WINSOCK2.H> 


”结构 XYZ (X. Y.ZD 中 域 站 的 偏 移 量 的 计算 公式 为 &((XYZ 9)0)->Y， 使 用 时 需 注意 类 型 转换 。 


typedef struct OV Data( 


SOCKET sock; 
WSABUF wsaBuf; 
chardata[65]; 
WSAOVERLAPPED ol; 


JOV Data; 


SOCKET g sockSvr - INVALID SOCKET; 


第 18 章 客户 一 服务 器 模型 


void CALLBACK ProcessData (DWORD dwError, DWORD cbTransferred, LPWSAOVERLAPPED 


lpOverlapped, DWORD dwFlags) 


OV Data *lpovd = CONTAINING RECORD(lpOverlapped, OV Data, ol); 
//OV Data*lpovd- (OV Data *) ( (PCHAR) lpOverlapped - (UINT PTR) (&((OV Data 


*)0)-201)); 


if(dwError!-0 || cbTransferred--0) 
return; 


printf("%s\n", lpovd-»wsaBuf.buf); 


send(g sockSvr, lpovd-»wsaBuf.buf, cbTransferred, 0); 


int main(int argc, char* argv[]) 


{ 


int ret; 

WSAData wsaData; 

WSAStartup (WINSOCK_VERSION, &wsaData) ; 
// 创建 WSA_FLAG_OVERLAPPED 属 性 的 套 接口 
SOCKET sockListen = 
WSA_FLAG OVERLAPPED); 


struct sockaddr in local; 

memset (&local, 0, sizeof (local)); 
local.sin addr.s addr = INADDR_ANY; 
local.sin family - AF INET; 
local.sin port - htons(9999); 


WSASocket(AF INET, 


SOCK STREAM, 0, NULL, 0, 


bind(sockListen, (struct sockaddr *) &local, sizeof(local)); 


listen(sockListen, 1); 


g_sockSvr = accept(sockListen, NULL, NULL); 


closesocket (sockListen) ; 


// 创建 Winsock 事 件 对 象 


WSAEVENT ev = WSACreateEvent () 


OV Data ovd; 
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unsigned long nRecved; 
DWORD flags; 


while (1) { 
memset (&ovd, 0, sizeof (ovd)); 
ovd.ol.hEvent = ev; 
ovd.wsaBuf.buf = ovd.data; 
ovd.wsaBuf.len = 65; 
ovd.sock = g_sockSvr; 


nRecved = 0; 
flags = 0; 


if (WSARecv(g_sockSvr, &(ovd.wsaBuf), 1, &nRecved, &flags, &(ovd.ol) 
ProcessData) SOCKET_ERROR) { 
ret = WSAGetLastError (); 
if(ret != WSA_IO_PENDING) { 
printf ("WSARecv: %d\n", ret); 
break; 


} 
else if(nRecved == 0){// 对 方 关闭 了 连接 !!1! 
printf ("对 方 关闭 了 连接 !!!\n"); 


break; 


ret = SleepEx(12000, TRUE); 

if(ret == 0){ 
printf ("Wait time out!\n"); 
break; 

} 

else if(ret == WAIT_IO COMPLETION) 
continue; 

else 
break; 


WSACloseEvent (ev) ; 
closesocket(g sockSvr); 
WSACleanup(); 

return 0; 


) 
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182.5 W/O 完成 端口 一 一 IOCP 
IOCP 从 本 质 上 来 说 仍然 属于 重 琶 VO, 它 是 到 目前 为 止 Win32 平台 下 效率 最 高 的 多 线程 
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网 络 编程 模型 ， 适 用 于 具有 高 扩展 性 的 高 性 能 网 络 服务 器 的 设计 和 实现 。 但 是 ， 需 要 注意 的 
是 ， 该 模型 仅 能 用 于 Windows NT、Windows 2000 之 后 的 操作 系统 。 


18.2.5.1 基本 函数 


IOCP 模型 的 核心 概念 是 完成 端口 ， 它 是 一 种 非常 复杂 的 内 核对 象 。 在 用 户 进程 将 一 个 
或 者 〈 通 常 ) 多 个 套 接口 ' 与 之 绑 定 Associate》 后 ， 当 这 些 套 接口 上 有 重生 LO 操作 请 求 完 
成 时 ， 系 统 就 会 自动 将 完成 信息 报 放 入 一 个 FIFO 类 型 的 UO 完成 队列 〈 见 图 18.5). 中 以 达 
到 通知 应 用 程序 的 目的 ， 而 用 户 进程 通常 需要 创建 多 个 工作 线程 来 处 理 这 些 通知 信息 。 

IOCP 涉及 到 三 个 基本 函数 : CreateloCompletionPort, GetQueuedCompletionStatus 和 
PostQueuedCompletionStatus。 第 一 个 函数 用 于 完成 端口 的 创建 和 完成 端口 与 套 接口 的 绑 定 ， 
第 二 个 用 于 从 完成 队列 中 获取 完成 信息 ， 最 后 一 个 用 于 模拟 IO 请 求 的 完成 。 

(1) CreateloCompletionPort 函数 定义 如 下 : 


HANDLE CreateloCompletionPort ( 


HANDLE FileHandle, // handle to file 
HANDLE ExistingCompletionPort, // handle to I/O completion port 
ULONG PTR CompletionKey, // completion key 
DWORD NumberOfConcurrentThreads // number of threads to execute 


// concurrently 
Fi 


需要 特别 注意 的 是 , 该 函数 不 仅 用 于 完成 端口 的 创建 , 还 用 于 完成 端口 和 套 接口 的 绑 定 。 
因此 它 的 使 用 可 分 为 两 个 阶段 : 

阶段 1: 完成 端口 的 创建 

我 们 只 需要 关心 最 后 一 个 参数 NumberOfConcurrentThreads, 其 余 三 个 参数 可 以 依次 设置 
为 INVALID HANDLE VALUE、NULL 和 0。NumberOfConcurrentThreads 定义 了 在 该 完成 
端口 上 可 以 同时 工作 的 最 大 线程 数 ， 通 常情 况 下 该 数目 应 与 系统 的 处 理 器 个 数 相同 ， 通 过 将 
NumberOfConcurrentThreads 赋值 为 0 系统 能 自动 完成 这 样 的 设置 。 可 能 的 完成 端口 创建 代码 
如 下 : 


HANDLE hIOCP = CreateIoCompletionPort (INVALID HANDLE VALUE, NULL, 0, 0); 


如 果 函 数 操作 成 功 返 回 创建 的 IOCP 句柄 ， 否 则 返回 NULL， 这 时 可 以 用 GetLastError 
函数 来 查询 错误 信息 。 

阶段 2:， 完成 端口 与 套 接口 的 绑 定 

这 时 四 个 参数 的 意义 分 别 是 : FileHandle， 指 向 需要 进行 重合 VO 操作 的 设备 句柄 ， 在 这 
儿 就 是 套 接口 ，ExistingCompletionPort， 指 向 刚 创建 的 完成 端口 的 句柄 ; CompletionKey， 完 
成 键 ， 又 称 单 句柄 ( 套 接口 ) 数据， 用 于 指定 VO 操作 涉及 的 设备 的 特定 信息 ， 工 作 线程 调 
用 GetQueuedCompletionStatus 函数 可 以 获得 该 数据 : NumberOfConcurrentThreads， 设 置 为 0 
即 可 。 示 例 代码 如 下 : 


” 完成 端口 并 不 仅仅 适用 于 套 接口 编程 ， 它 事实 上 是 Win32 平台 下 的 一 种 通用 VO 机 制 ， 可 与 之 绑 定 的 设 
备 有 文件 、 套 接口 、 邮 槽 、 管 道 等 。 
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typedef struct _CPKey{ 
SOCKET svrSock; 
) PER SOCKET DATA, *LPPER SOCKET DATA; 
LPPER SOCKET DATA lpPerSocketData; 
SOCKET svrSock = accept(sock, NULL, NULL); 
CreateloCompletionPort ((HANDLE) svrSock, hlOCP, (DWORD) lpPerSocketData, 0); 


为 两 个 完全 不 同 的 功能 提供 同一 个 函数 接口 ， 非 常 容易 引起 混淆 ， 因 此 程序 设计 人 员 通 
常用 两 个 自 定 义 函 数 来 对 CreateIoCompletionPort 进行 包装 : 


HANDLE CreateNewIoCompletionPort (DWORD dwNumberOfConcurrentThreads) { 
return (CreateloCompletionPort (INVALID_HANDLE_VALUE, NULL, 0 
dwNumberOfConcurrentThreads)); 


) 
BOOL AssociateWithlIoCompletionPort (HANDLE hComPort, HANDLE hDevice, DWORD 


dwCompKey) { 
return (CreateIoCompletionPort (hDevice,  hComPort, dwCompKey, 0) == 
hComPort) ; 

} 


当然 , 这 种 复杂 的 设计 也 并 非 毫 无 意义 ,事实 上 可 以 用 一 次 CreateloCompletionPort 函数 
调用 就 实现 完成 端口 的 创建 和 与 一 个 设备 相 绑 定 的 功能 。 下 面 的 代码 将 一 个 服务 套 接口 与 新 
创建 的 完成 端口 HOCP 绑 定 ， 并 且 设 置 完成 端口 允许 最 多 两 个 线程 同时 工作 : 


SOCKET svrSock = accept (sock, NULL, NULL); 
HANDLE hIOCP = CreateIoCompletionPort ((HANDLE)svrSock, NULL, (DWORD 
lpPerSocketData, 2); 


(2) GetQueuedCompletionStatus 函数 定义 如 下 : 


BOOL GetQueuedCompletionStatus ( 


HANDLE CompletionPort, // handle to completion port 
LPDWORD lpNumberOfBytes, // bytes transferred 

PULONG PTR lpCompletionKey, // file completion key 
LPOVERLAPPED *lpOverlapped, // buffer 

DWORD dwMilliseconds // optional timeout value 


LE 


该 函数 用 于 获取 指定 VO 完成 端口 的 完成 信息 。 如 果 没 有 完成 信息 ， 那 么 函数 将 阻塞 直 
BVO 操作 完成 或 者 超时 。 五 个 参数 中 第 一 个 和 最 后 一 个 是 输入 参数 ， 其 余 都 是 输出 参数 。 
CompletionPort， 用 于 指定 我 们 关心 的 完成 端口 的 句柄 : IpNumberOfBytes， 用 于 返回 IO 操 
作 所 传输 的 字 节 数 ， lpCompletionKey， 返 回 IO 操作 涉及 的 单 文件 句柄 数据 ; lpOverlapped， 
BATHE IO 操作 时 指定 的 重 又 结构 ， 使 用 18.2.4 节 介 绍 到 的 技术 可 以 在 IpOverlapped 
上 追加 任意 数量 的 数据 一 一 称 为 单 IO 操作 数据 ; dwMilliseconds， 指 定 函数 等 待 完 成 信息 出 
现 的 时 间 ， 以 毫秒 为 单位 ， 如 果 设 置 为 INFINITE 表示 无 限期 等 待 ， 设 置 为 0 表示 采取 询问 
方式 函数 立即 返回 。 
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GetQueuedCompletionStatus 函数 返回 值 的 情况 有 些 复杂 ， 正 确 完整 的 示例 代码 如 下 : 


BOOL ret =  GetQueuedCompletionStatus (hIOCP, &dwNumBytes, &CompKey, 
&pOverlapped, 1000); 
if (ret) { // 非 0 返 回 值 ， 成 功 
// dequeues a completion packet for a successful I/O operation 
H 
else( // 返回 0， 失 败 
DWORD dwError = GetLastError(); 
if (pOverlapped != NULL) { 
// dequeues a completion packet for a failed I/O operation 
// dwError contains the reason for failure 
} 
else { 
// does not dequeue a completion packet 
// dwError contains the reason for failure 
if (dwError == WAIT_TIMEOUT) { 
// 超时 
} 
else { 
// Bad call to GetQueuedCompletionStatus 
// dwError contains the reason for the bad call 


} 


(3) PostQueuedCompletionStatus 函数 定义 如 下 : 


BOOL PostQueuedCompletionStatus ( 


HANDLE CompletionPort, // handle to an I/O completion port 
DWORD dwNumberOfBytesTransferred, // bytes transferred 

ULONG PTR dwCompletionKey, // completion key 

LPOVERLAPPED lpOverlapped // overlapped buffer 


LI 


该 函数 用 于 向 完成 端口 CompletionPort 投递 VO 完成 信息 包 。 三 个 参数 dwNumberOf- 
BytesTransferred, dwCompletionKey fil IpOverlapped 会 在 调用 函数 GetQueuedCompletionStatus 
时 返回 。 

PostQueuedCompletionStatus 函数 提供 了 与 工作 线程 通信 的 手段 。 假 设 要 终止 应 用 进程 ， 
但 是 希望 各 个 工作 线程 (假设 有 四 个 ) 能 先进 行 相应 的 资源 释放 , 那么 PostQueuedCompletion- 
Status 就 是 一 个 很 好 的 途径 。 我 们 可 以 简单 地 以 特定 参数 一 般 将 完成 键 置 为 NULLO 调用 
次 PostQueuedCompletionStatus， 当 工作 线程 GetQueuedCompletionStatus 返回 该 参数 ， 也 
就 获知 了 关闭 通知 ， 可 以 进行 相应 的 线程 退出 处 理 了 。 

但 是 需要 注意 的 是 ， 如 果 并 不 是 通知 线程 退出 ， 这 时 线程 会 再 次 调用 GetQueued- 
CompletionStatus 函数 ， 那 么 由 于 等 待 线程 队列 是 LIFO 方式 的 ， 很 可 能 造成 同一 个 线程 接收 
了 所 有 的 PostQueuedCompletionStatus 发 送 的 信息 ， 而 其 他 线程 无 法 接收 的 局 面 。 要 解决 这 
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个 问题 ， 编 程 人 员 必 须 做 好 各 个 线程 之 间 的 同步 工作 。 
18252 ”重要 概念 


我 们 已 经 了 解 了 完成 端口 涉及 到 的 三 个 重要 函数 ， 在 介绍 模型 的 内 部 工作 机 制 之 前 ， 先 
对 几 个 重要 概念 进行 分 析 和 比较 。 

(1) BARGE ERE) RU IO 操作 数据 

相对 来 说 ， 单 句柄 数据 对 于 套 接口 来 说 是 静态 数据 ， 而 单 VO 操作 数据 是 动态 数据 。 一 
个 完成 端口 上 一 般 有 多 个 套 接 口 与 之 绑 定 ， 每 个 套 接口 对 应 一 个 单 句柄 数据 结构 〈 在 完成 端 
口 和 套 接口 绑 定时 设 定 ) ， 在 同一 个 套 接口 上 进行 的 每 一 次 IO 操作 都 有 一 个 单 IO 操作 数 
据 结 构 与 之 对 应 , 不 同 次 之 间 的 单 IO 操作 数据 一 般 不 同 ( 在 投递 重 又 IO 操作 时 进行 设 定 ) 。 
我 们 以 一 个 认证 服务 器 为 例 来 解释 两 者 的 区 别 和 应 用 : 假设 服务 器 可 以 同时 为 多 个 客户 端 服 
务 ， 认 证 过 程 需要 多 步 网 络 数据 交互 。 那 么 ， 当 工作 线程 调用 GetQueuedCompletionStatus 
后 ， 它 可 以 从 单 句柄 数据 CpCompletionKey) 获知 是 哪 一 个 套 接口 〈 哪 一 个 连接 ， 也 就 是 哪 
一 个 客户 ) 上 有 IO 完成 ， 从 单 VO 操作 数据 (lpOverlapped) 获知 这 个 连接 上 的 协议 交互 已 
进行 到 哪 一 个 阶段 等 。 

(2) 工作 线程 数 与 同时 工作 线程 数 

工作 线程 数 与 同时 工作 线程 数 是 两 个 不 同 的 概念 ， 同 时 工作 线程 数 一 般 与 系统 处 理 器 的 
个 数 相同 ， 而 工作 线程 不 仅 包括 了 同时 工作 线程 还 包含 了 处 于 等 待 和 暂停 状态 的 工作 线程 。 
参照 图 18.6， 完 成 端口 应 用 进程 的 工作 进程 是 指 等 待 线 程 队 列 、 运 行 线程 列表 以 及 暂停 线程 
列表 中 的 所 有 线程 的 集合 ， 而 同时 工作 线程 是 指 运行 线程 列表 中 的 线程 。 
18.2.5.3 内 部 工作 机 制 


当 应 用 进程 创建 了 一 个 完成 端口 ， 系 统 事实 上 为 该 完成 端口 创建 了 五 个 不 同 的 数据 结 
构 ， 分 别 是 设备 列表 、LO 完成 队列 、 等 待 线程 队列 、 运 行 线程 列表 和 暂停 线程 列表 。 

(1) 设备 列表 

设备 列表 用 于 保存 与 该 完成 端口 绑 定 的 所 有 设备 的 信息 ,每 条 记录 含 设备 句柄 和 完成 键 
两 个 域 。 事 实 上 完成 键 对 于 内 核 来 说 没有 意义 ， 它 只 是 应 用 进程 用 于 建立 完成 键 和 设备 之 间 
的 对 应 关系 ， 并 以 此 来 标志 设备 的 一 种 手段 。 

当 应 用 进程 调用 CreateloCompletionPort 函数 将 一 个 设备 句柄 与 完成 端口 绑 定 , 那么 该 设 
备 的 句柄 以 及 应 用 进程 指定 的 完成 键 信息 将 会 被 添加 到 设备 列表 中 ;而 当 一 个 设备 被 关闭 ， 
那么 该 设备 所 对 应 的 表 项 就 会 被 删除 。 


FileHandle dwCompletionKey 


+ 调用 CreateloCompletionPort 函数 。 
一 设备 句柄 被 关闭 。 
GE: 其 中 十 表示 添加 表 项 ， 一 表示 删除 表 项 ， 下 同 ) 


图 18.4 设备 列表 


(2) LO 完成 队列 
LO 完成 队列 用 于 保存 VO 完成 信息 。 当 有 VO 请 求 完成 或 者 应 用 进程 调用 
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PostQueuedCompletionStatus 函数 , 都 会 有 相应 的 IO 完成 信息 加 入 此 队列 ; 当 该 队列 不 为 空 ， 
那么 某 个 线程 的 GetQueuedCompletionStatus 函数 调用 将 成 功 返 回 , 同时 被 返回 的 完成 信息 会 
被 从 队列 中 删除 ， 如 图 18.5 所 示 。 


| awBytesTransferred | dwCompletionKey | pOverlapped | dwError | 
+ VO 请 求 完成 。 
十 调用 了 PostQueuedCompletionStatus 函数 。 
一 完成 端口 从 等 待 线程 队列 中 移 除 了 一 个 表 项 。 


图 18.5 VO 完成 队列 


G) 等 待 线程 队列 、 运 行 线程 列表 和 和 暂停 线程 列表 

为 了 提高 完成 端口 的 多 线程 模型 的 效率 ， 微 软 为 它 提供 等 待 线程 队列 、 运 行 线程 列表 和 
暂停 线程 列表 这 样 三 种 数据 结构 ， 如 图 18.6 所 示 ， 分 别 对 应 工作 线程 的 三 种 状态 ， 并 在 此 基 
础 上 实现 了 非常 精细 的 线程 调度 算法 。 

等 待 (Waiting) 线 程 队 列 (LIFO) 
dwThreadID 

十 线程 调用 GetQueuedCompletionStatus 函数 。 
一 VO 完成 队列 不 为 空 并 且 运 行 中 线程 数 少 于 最 大 并 发 线程 数 。 


运行 (Released) 线程 列表 


dwThreadID 


十 完成 端口 唤醒 等 待 线程 队列 中 的 线程 。 

十 暂停 的 线程 被 唤醒 。 

一 线程 再 次 调用 GetQueuedCompletionStatus 函数 。 
一 线程 调用 某 个 函数 将 自己 挂 起 。 


暂停 (Paused) 线程 列表 


十 运行 线程 调用 某 个 函数 将 自己 挂 起 。 


一 挂 起 的 线程 被 唤醒 。 


图 18.6 线程 队列 列表 


线程 初始 时 一 般 阻塞 在 GetQueuedCompletionStatus 函数 调用 上 ， 此 时 处 于 等 待 队列 
(LIFO) 中 ; 当 有 一 个 VO 完成 信息 包 被 投放 至 完成 队列 ， 系 统 会 首先 检查 与 完成 端口 联系 
的 线程 有 多 少 正在 运行 中 ， 如 果 运 行 线程 数 少 于 可 同时 工作 线程 数 ， 那 么 等 待 线程 队列 中 的 
最 后 一 个 到 达 的 线程 将 被 转 为 运行 状态 以 处 理 该 完成 信息 ， 此 时 该 线程 信息 会 被 从 等 待 线程 
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队列 中 删除 并 加 入 运行 线程 列表 ; 否则 ， 系 统 会 让 某 一 个 运行 线程 处 理 完 当 前 的 完成 信息 后 
再 处 理 该 完成 信息 。 这 种 调度 机 制 的 优点 是 减少 了 线程 上 下 文 环境 的 切换 。 

运行 线程 列表 中 的 线程 如 果 调 用 了 Sleep、WaitForSingleObject 等 函数 将 自己 挂 起 , 那么 
系统 会 将 该 线程 从 运行 线程 列表 中 删除 并 转 入 暂停 线程 列表 ; 此 时 如 果 完 成 队列 中 有 完成 信 
息 待 处 理 ， 那 么 系统 将 让 等 待 线程 队列 中 最 后 一 个 线程 运行 以 处 理 该 信息 ; 考虑 前 面 的 线程 
Sleep 结束 并 再 次 运行 的 情况 ， 我 们 可 以 发 现 ， 在 随后 的 一 段 时 间 里 实际 的 同时 工作 线程 数 
超过 了 NumberOfConcurrentThreads 的 规定 值 。 当 然 这 个 阶段 是 非常 短暂 的 ， 实 际 同时 工作 
的 线程 数目 会 很 快 下 降 至 不 高 于 NumberOfConcurrentThreads 值 。 这 也 就 说 明了 为 什么 实际 
同时 工作 的 线程 数 并 不 一 定 会 少 于 或 者 等 于 NumberOfConcurrentThreads 值 。 
182.54 两 个 问题 


问题 一 : 应 用 进程 应 该 创建 多 少 工作 线程 ? 

对 于 一 般 的 服务 器 程序 来 说 ， 建 议 创建 CPU 数目 X2 这 么 多 个 工作 线程 ， 也 就 是 说 对 于 
双 CPU 主机 来 说 应 该 有 四 个 工作 线程 。 

但 是 在 实际 应 用 中 ， 特 别 是 对 于 一 些 性 能 要 求 很 高 的 服务 器 来 说 ， 那 么 一 个 具有 一 定 智 
能 性 的 启发 式 算 法 是 必需 的 。 创 建 还 是 关闭 工作 线程 , 该 算法 必须 综合 考虑 当前 的 线程 总 数 、 
运行 状态 线程 数 、 系 统 负荷 等 因素 。 相 关内 容 可 参阅 (Programming Server-Side Applications for 
MS Windows 2000》 一 书 。 

问题 二 : 如 何 投递 VO 请 求 却 又 不 引起 完成 队列 中 的 信息 变动 ? 

当 用 完成 端口 模型 进行 套 接口 编程 时 ， 一 个 现实 的 问题 是 应 用 进程 通常 对 数据 的 发 送 情 
况 不 关心 ， 当 调用 WSASend 函数 时 一 般 都 认为 发 送 会 成 功 并 立即 返回 ， 而 事实 上 也 确实 如 
此 。 要 进行 发 送 操作 而 不 用 处 理 完成 信息 , 可 以 将 重 又 结构 的 hEvent 域 置 为 一 个 合法 的 事件 
句柄 与 值 1 的 “或 ” 值 ， 如 下 : 

Overlapped.hEvent CreateEvent (NULL, TRUE, FALSE, NULL); 


Overlapped.hEvent (HANDLE) ((DWPRD_PTR) Overlapped.hEvent | 1); 
// Do some I/O operation with Overlapped 


当 要 关闭 事件 句柄 时 ， 必 须 首先 将 该 句柄 进行 反 处 理 ; 
CloseHandle((HANDLE) ((DWORD_PTR) Overlapped.hEvent & ~1)); 


我 们 已 经 讨论 了 完成 端口 的 工作 机 制 和 相应 的 函数 操作 , 对 于 具体 的 应 用 过 程 将 在 第 21 
章 给 出 详细 的 介绍 。 


第 19 音 ” 套 接口 选项 


套 接口 选项 是 套 接口 编程 的 重要 内 容 ， 涉 及 到 报 文 的 广播 和 多 播 以 及 原始 套 接口 等 多 个 
方面 。 本 章 第 一 节 介 绍 套 接口 选项 涉及 的 两 个 基本 函数 setsockopt 和 getsockopt 以 及 相关 的 
基本 知识 ， 并 涉及 到 WSAIoctl 函数 的 使 用 ， 在 随后 的 三 节 分 别 介绍 如 何 进行 广播 、 多 播 和 
原始 套 接口 编程 。 


19.1 套 接口 选项 


使 用 setsockopt 和 getsockopt 函数 可 以 设置 或 者 读 取 套 接口 的 选项 值 ， 这 两 个 函数 的 定 
义 如 下 : 
int setsockopt (SOCKET s, int level, int optname, const char FAR *optval, int 
optlen); 


int getsockopt (SOCKET s, int level, int optname, char FAR *optval, int FAR 
*optlen); 


其 中 参数 s[IN/IN] (分 别 对 应 setsockopt 和 getsockopt， 下 同 ) 是 我 们 感 兴趣 的 套 接口 描 
述 字 ，level[IN/IN] 是 套 接口 选项 的 级 别 ，optname[IN/IN] 是 用 户 指定 的 选项 名 称 ， 
optval[IN/OUT] 是 一 个 指向 变量 的 指针 ， 它 的 大 小 由 optlen[IN/INOUT] 指 定 ， 通 过 optval 可 
以 设置 或 者 读 取 指定 选项 的 值 。 

如 果 没 有 错误 发 生 ， 函 数 返回 0， 否 则 返回 SOCKET ERROR. 

Winsock 的 套 接口 选项 主要 有 两 种 类 型 : 布尔 型 ， 用 于 启用 或 禁止 套 接口 的 某 个 属性 ; 
选项 参数 ， 整 型 或 者 结构 体 ， 设 置 特定 的 值 。 为 了 启用 某 个 布尔 型 选项 ，optval 应 指向 某 个 
非 零 整 数 ， 若 要 禁用 则 指向 一 个 零 值 整数 ， 同 时 optlen 参数 值 应 该 等 于 布尔 型 大 小 ， 即 
sizeof(BOOL); 对 于 其 他 选项 类 型 ，optval 应 指向 整 型 或 者 结构 体 ，optlen 值 为 整 型 或 者 结构 
体 的 大 小 。 

Winsock 支持 的 全 部 选项 级 别 有 IPPROTO IP. IPPROTO IPV6, IPPROTO RM, 
IPPROTO_TCP, IPPROTO UDP, NSPROTO IPX, SOL APPLETALK、SOL IRLMP 和 
SOL_SOCKET。 下 面 以 选项 的 设置 为 主 介绍 其 中 的 几 个 级 别 的 常用 选项 参数 。 


19.1.1 SOL SOCKET 


(D SO BROADCAST, BOTH, 布尔 型 (BOOL) 。 
用 于 允许 /禁止 发 送 广播 报 文 。 该 选项 将 在 19.2 节 详 细 讨 论 。 
(2) SO_LINGER，BOTH，LINGER 结构 型 ， 定 义 如 下 : 
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struct linger { 
u_short l onoff; 
u short 1 linger; 


} 


其 中 1 onoff 用 于 指定 如 果 调 用 closesocket 函数 后 还 有 数据 竺 发送， 是 否 需 要 延 时 关闭 
套 接口 。1 linger 用 于 设 定 启 用 SO_LINGER 时 等 待 数据 发 送 的 时 间 。 

该 选项 用 于 控制 当 关 闭 套 接口 时 如 果 缓 冲 区 里 仍 有 数据 待 发 送 ，closesocket 函数 的 处 理 
方式 ， 要 不 要 延缓 关闭 以 等 待 数据 发 送 完毕 。 

要 启用 SO_LINGER， 应 用 程序 应 该 给 | onoff 赋 一 个 非 零 值 ， 并 且 设 置 linger 为 0 或 
者 需要 的 等 待 时 间 (以 秒 为 单位 )， 然后 调用 setsockopt 函数 ; 为 了 指定 SO DONTLINGER 
(禁用 SO_LINGER) , ，L onoff 应 该 被 设置 为 0。 需 要 注意 的 是 ， 应 该 避免 在 非 阻塞 套 接口 
上 启用 SO_LINGER 选项 同时 设置 非 0 的 延 时 值 。 

(3) SO DONTLINGER，BOTH， 布 尔 型 ， 用 于 禁用 LINGER. 

设置 该 选项 后 ， 如 果 有 数据 待 发 送 那么 套 接口 关闭 的 操作 将 被 延缓 。 该 选项 等 价 于 以 
1 onoff 为 0 设置 SO_LINGER 选项 。 

(4) SO KEEPALIVE，BOTH， 布 尔 型 ， 周 期 性 地 测试 连接 是 否 存活 。 

应 用 进程 为 一 个 TCP 套 接口 设置 了 SO_KEEPALIVE 选项 后 , 如 果 固 定时 间 内 (默认 为 
2 个 小 时 ) 在 此 套 接口 上 通信 的 两 个 方向 上 都 没有 数据 流量 ， 那 么 系统 会 自动 向 对 方 发 送 一 
个 保持 存活 探测 分 组 以 检测 对 方 的 状态 正常、 服务 关闭 或 者 无 响应 ) 。 如 果 探 测 认为 连接 
已 断 开 ,那么 在 此 套 接口 上 的 任何 操作 都 会 返回 错误 码 WSAENETRESET， 随 后 的 操作 返回 
WSAENOTCONN. 

在 很 多 情况 下 ， 两 个 连接 的 套 接口 之 间 会 长 时 间 没 有 数据 发 送 ， 这 就 意味 着 在 长 期 存活 
的 进程 中 空闲 的 套 接口 可 能 几 分 钟 、 几 小 时 、 甚 至 于 几 天 都 不 会 提交 数据 ， 也 就 不 会 发 现 对 
方 可 能 已 断 线 。 因 此 ， 假 设 某 个 客户 端 衣 演 了 ， 那 么 另外 一 端 主 机 的 资源 ， 例 如 CPU 时 间 
和 内 存 ， 就 会 浪费 在 那个 永远 不 会 响应 的 客户 端 上 。 

很 自然 地 ， 我 们 会 希望 SO KEEPALIVE 选项 能 用 于 连接 存活 检测 的 心跳 测试 ， 以 避免 
这 种 情况 的 发 生 。 由 于 系统 的 默认 设置 是 空闲 2 小 时 才 发 送 一 个 探测 分 组 ， 并 不 能 保证 检测 
的 实时 性 ， 因 此 必须 修改 时 间 间 隔 参 数 。 在 Windows 2000 之 前 ， 对 时 间 间 隔 参数 的 修改 都 
是 操作 系统 级 别 的 , 也 就 是 说 这 种 修改 会 影响 到 所 有 打开 此 选项 的 套 接口 。 在 Windows 2000 
及 其 之 后 的 操作 系统 中 , 对 IO 控制 函数 WSAIoctl 引入 了 一 个 新 的 控制 码 SIO_ KEEPALIVE 
_VALS (在 MSTcpIP.h 中 定义 ， 在 该 文件 中 还 定义 了 其 他 一 些 新 的 WSAIoctl 选项 如 
SIO_RCVALL) ， 可 用 它 针对 单个 套 接 口 更 改 其 “保持 活动 ” 值 以 及 发 送 的 间隔 时 间 。 该 控 
制 码 操作 涉及 到 的 tcp_keepalive 结构 体 定义 如 下 : 


struct tcp_keepalive { 
u_long onoff; 
u_long keepalivetime; 
u_long keepaliveinterval; 


E 
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但 是 ， 我 们 仍然 建议 不 采用 SO_KEEPALIVE 选项 而 是 自己 编写 应 用 层面 上 的 超时 检测 
机 制 〈 心 跳 检 测 ) 来 保证 连接 的 存活 。 最 常见 的 方法 是 使 用 带 外 数据 ， 这 样 也 能 确保 不 会 干 
扰 正 常 的 数据 通信 。 

(5) SO RCVBUF, BOTH, int 型 ， 为 每 个 套 接口 设 定 / 读 取 接收 缓冲 区 的 大 小 。 

该 缓冲 区 的 大 小 与 SO_MAX_MSG SIZE 常量 值 或 者 TCP 窗口 大 小 有 关 。 应 用 进程 可 以 
为 不 同 的 套 接口 申请 不 同 的 接收 缓冲 区 大 小 ， 但 是 当 setsockopt 成 功 时 并 不 说 明 内 核 就 提供 
了 请 求 大 小 数量 的 缓冲 区 ， 可 以 用 同样 的 选项 调用 getsockopt 来 检测 实际 提供 的 缓冲 区 大 小 
值 。 

如 果 将 SO_RCVBUF 设置 为 0, 将 导致 接收 数据 在 比 Winsock 更 底层 被 缓存 ， 因 此 并 不 
能 提高 反而 会 影响 系统 的 性 能 。 

(6) SO_SNDBUF，BOTH，int 型 ， 为 每 个 套 接口 设 定 / 读 取 发 送 缓冲 区 的 大 小 。 

该 缓冲 区 的 大 小 与 SO MAX MSG SIZE 常量 值 或 者 TCP 窗口 大 小 有 关 。 应 用 进程 可 以 
为 不 同 的 套 接口 申请 不 同 的 发 送 缓冲 区 大 小 ， 但 是 当 setsockopt 成 功 时 并 不 说 明 内 核 就 提供 
了 请 求 大 小 数量 的 缓冲 区 ， 我 们 可 以 用 同样 的 选项 调用 getsockopt 来 检测 实际 提供 的 缓冲 区 
大 小 值 。 

如 果 应 用 进程 将 SO_SNDBUF 设置 为 0 并 且 调 用 阻塞 数据 发 送 , 那么 内 核 就 会 将 应 用 进 
程 的 缓存 锁定 直至 发 送 API 调用 成 功 。 仅 当 我 们 需要 开发 一 个 高 性 能 的 服务 器 程序 时 ， 才 考 
虑 将 套 接口 的 发 送 缓冲 区 设置 为 0。 需 要 注意 的 是 ， 这 时 的 服务 器 程序 应 该 是 能 同时 发 送 多 
NER send 的 ， 而 不 需要 线性 地 等 待 一 个 发 送 操作 完毕 再 进行 下 一 个 发 送 函数 调用 。 

(7) SO REUSEADDR，BOTH， 布 尔 型 ， 允 许 套 接口 绑 定 一 个 已 在 使 用 的 地 址 。 

默认 情况 时 ， 套 接口 是 无 法 绑 定 一 个 已 在 使 用 的 地 址 的 。 我 们 知道 ， 不 同 的 连接 是 由 双 
方 的 < 地 址 ， 端 口 > 来 区 分 的 ， 因 此 连接 不 同 的 目的 端 时 两 个 进程 使 用 本 地 的 同一 个 端口 也 是 
可 行 的 。 在 重用 本 地 地 址 时 ， 必 须 启 用 SO_REUSEADDR 选项 。 

事实 上 ，SO_REUSEADDR 选项 更 多 的 是 在 服务 器 编程 时 需要 使 用 。 当 服务 器 进程 需要 
重启 时 ， 经 常会 碰 到 监听 端口 尚未 完全 关闭 的 情况 〈 处 于 TIME. WAIT 状态 ) ， 这 时 如 果 没 
有 启用 SO_REUSEADDR 选项 ， 那 么 bind 操作 就 会 报 WSAEADDRINUSE 错误 。 因 此 ， 一 
般 进 行 服务 器 编程 时 都 会 对 监听 端口 启用 SO REUSEADDR. 

(8) SO_RCVTIMEO, BOTH, struct timeval 结构 型 ， 用 于 设置 数据 接收 超时 值 。 

该 选项 用 于 在 一 个 阻塞 套 接 口 为 接收 函数 设 定 一 个 超时 值 。 当 调用 接收 函数 时 ， 如 果 在 
SO RCVTIMEO 指定 的 时 间 内 没有 数据 到 来 ， 那 么 函数 调用 也 会 结束 并 且 返 回 错误 10060 

(WSAETIMEDOUT) 。 

(9) SO_SNDTIMEO, BOTH, struct timeval 结构 型 ， 用 于 设置 数据 发 送 超时 值 。 

该 选项 用 于 在 一 个 阻塞 套 接口 为 发 送 函数 设 定 一 个 超时 值 。 当 调用 发 送 函 数 时 ， 如 果 在 
SO_RCVTIMEO 指定 的 时 间 内 数据 还 未 发 送 成 功 ， 那 么 函数 调用 也 会 结束 并 且 返 回 错误 
10060 (WSAETIMEDOUT) 。 

以 SO RCVTIMEO 为 例 说 明 SOL SOCKET 选项 的 使 用 。 下 面 的 例子 演示 了 如 何 为 
TCP/UDP 套 接口 设置 并 读 取 接 收 超时 值 。 对 于 TCP 套 接口 ， 程 序 连接 WEB 服务 器 
202.119.24.32 (www.seu.edu.cn) ,并 希望 能 在 10 秒 内 收 到 对 方 主动 发 送 来 的 数据 ; 对 于 UDP 
套 接口 ， 程 序 监听 本 地 的 9999 端口 然后 等 待 外 来 的 UDP 报 文 。 
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FAK IA KAA TAK IA ERK EA KIA AKA EIE19.1 SO RCVTIMEO J30X996& 4 AERA R RARER EERIE 


#pragma comment (lib, "ws2_32.1lib") 
#include <STDIO.H> 
#include «WINSOCK2.H» 


#define TCP 


void HandleError (char *); 


int main(int argc, char* argv[]) 


{ 


WSAData wsaData; 
WSAStartup (WINSOCK_VERSION, &wsaData); 
DWORD begin, finish; 


struct timeval tv; 
tv.tv_sec = 10000; 

0; 

sizeof (tv); 


tv.tv usec 
int optlen 


#ifdef TCP 


SOCKET sock = socket (AF_INET, SOCK_STREAM, 0); 
printf ("TCP Test!\n"); 


struct sockaddr_in to; 

int len = sizeof (to); 

memset (&to, 0, len); 

to.sin addr.s addr = inet addr("202.119.24.32"); 
to.sin family - AF INET; 

to.sin port = htons (80); 


if(connect(sock, (struct sockaddr *) &to, len) -- 
HandleError ("connect"); 
closesocket (sock) ; 
WSACleanup(); 
return -1; 


SOCKET ERROR) { 


if(setsockopt(sock, SOL SOCKET, SO RCVTIMEO, (char *) &tv, optlen) == 


SOCKET ERROR)( 
HandleError ("setsockopt") ; 
closesocket (sock) ; 
WSACleanup () ; 
return -1; 


char buf[100]; 
begin = GetTickCount (); 
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if(recv(sock, buf, 100, 0) == SOCKET ERROR)( 
HandleError ("recv"); 
if(WSAGetLastError() == WSAETIMEDOUT) { 


printf ("WSAETIMEDOUT\n") ; 


} 
finish = GetTickCount (); 


#else // NOT TCP! 


SOCKET sock = socket (AF_INET, SOCK_DGRAM, 0); 
printf ("UDP Test!\n"); 


struct sockaddr_in local; 

int len = sizeof (local); 

memset (&local, 0, len); 

local.sin addr.s addr = INADDR ANY; 
local.sin family - AF INET; 
local.sin port - htons(9999); 


if(bind(sock, (struct sockaddr *) &local, len) == SOCKET ERROR) { 
HandleError ("bind"); 
closesocket (sock) ; 
WSACleanup(); 
return -1; 


if(setsockopt(sock, SOL SOCKET, SO RCVTIMEO, (char *) &tv, optlen) 
SOCKET ERROR)( 

HandleError ("setsockopt") ; 

closesocket (sock) ; 

WSACleanup(); 

return -1; 


char buf[100]; 
begin = GetTickCount (); 
if(recvfrom(sock, buf, 100, 0, NULL, NULL) == SOCKET ERROR)( 
HandleError ("recvfrom"); 
if(WSAGetLastError() == WSAETIMEDOUT) { 
printf ("WSAETIMEDOUT\n") ; 


} 
finish = GetTickCount (); 


#endif 


printf ("实际 等 待 时 间 (毫秒 ) : d\n", finish - begin); 
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memset (&tv, 0, optlen); 
if (getsockopt (sock, SOL SOCKET, SO RCVTIMEO, (char *) &tv, &optlen) == 
SOCKET ERROR) { 
HandleError ("getsockopt") ; 
} 
printf (" 设 置 等 待 时 间 (毫秒 ) : Sd\n", tv.tv sec); 


closesocket (sock) ; 
WSACleanup (); 


return 0; 


) 


void HandleError(char *func) 
t 
int errCode = WSAGetLastError(); 


char info[65] - (0); 
.Snprintf(info, 64, "%s: d\n", func, errCode); 
printf (info); 


) 
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程序 的 输出 结果 分 别 为 : 

TCP Test! UDP Test! 

recv: 10060 recvfrom: 10060 
WSAETIMEDOUT WSAETIMEDOUT 
实际 等 待 时 间 (毫秒 ) : 10516 实际 等 待 时 间 (毫秒 ) : 10532 
设置 等 待 时 间 (毫秒 ) : 10000 设置 等 待 时 间 (毫秒 ) : 10000 


19.1.2 IPPROTO_IP 


(D IP HDRINCL, BOTH, 布尔 型 ， 仅 适用 于 原始 套 接口 (SOCK RAW) 。 

如 果 应 用 程序 希望 能 接收 于 层 及 他 层 以 上 的 所 有 数据 或 者 自行 组 装 包含 I 了 P 层 在 内 的 报 
文 ， 那 么 可 以 设置 该 选项 为 TRUE。 将 在 19.4 节 对 该 选项 进行 详细 描述 。 

(2) IP ADD MEMBERSHIP, SET, struc ip mreq 结构 型 ， 用 于 加 入 多 播 组 。 

该 选项 用 于 将 指定 网 络 接口 上 的 套 接口 加 入 IP 多 播 组 ， 此 套 接口 必须 是 AF_INET 地 址 
族 并 且 类 型 为 SOCK DGRAM。 其 中 struct ip_mreq 结构 定义 如 下 : 


struct ip_mreq { 
struct in_addr imr multiaddr; /* IP multicast address of group */ 
struct in_addr imr interface;  /* local IP address of interface */ 


E 


其 中 imr multiaddr 对 应 于 打算 加 入 的 多 播 组 的 IPv4 地 址 ; 而 imr interface 是 本 地 接口 
的 他 地 址 ， 也 可 以 设置 为 INADDR_ANY， 表 明 选 择 的 是 默认 接口 。 
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(3) IP DROP MEMBERSHIP, SET, struc ip mreq 结构 型 ， 用 于 退出 多 播 组 。 该 选项 
的 使 用 与 IP ADD MEMBERSHIP 类 似 。 

(4) IP_MULTICAST_IF, BOTH, DWORD 类 型 ， 设 置 / 读 取 多 播 的 本 地 接口 。 

IP MULTICAST IF 选项 用 于 设置 或 读 取 本 地 接口 。 在 设置 了 本 地 的 多 播 外 出 接口 后 ， 
本 地 机 器 以 后 发 出 的 任何 多 播 数据 都 会 经 由 它 传送 出 去 ， 该 选项 适用 于 多 穴 主 机 。optval 参 
数 是 一 个 无 符号 的 长 整数 值 ， 对 应 于 本 地 接口 的 IPv4 地 址 。 可 用 inet addr 函数 将 一 个 字 串 
形式 的 下 地 址 (点 分 十 进 制 ) 转换 成 一 个 无 符号 的 长 整数 值 。 

(5) IP MULTICAST LOOP，BOTH， 布 尔 型 ， 用 于 启用 或 者 禁止 多 播报 文 环 回 。 

在 默认 的 情况 下 ， 当 发 送 Pp 多 播 数 据 时 ， 如 果 发 送 套 接 口 本 身 也 属于 该 多 播 组 ， 那 么 数 
据 会 原封 不 动 地 返回 一 份 至 套 接口 一 一 环 回 〈loopback) 。 若 将 该 选项 设 为 FALSE， 发 出 的 
任何 数据 都 不 会 投递 至 套 接 字 的 进入 数据 队列 中 。 

(6)IP_MULTICAST_TTL, BOTH, DWORD 类 型 , 设置 / 读 取 套 接口 上 耳 多 播 的 TTL 
值 。 

在 默认 情况 下 ， 多 播 数据 报 采 用 的 TTL (879 1. IP MULTICAST TTL 选项 可 用 于 读 取 
或 者 设 定 该 值 。 SHH TTL 值 的 大 小 影响 到 多 播 数 据 的 传播 范围 , 只 有 在 有 效 范围 内 的 组 成 员 
才 会 收 到 数据 。 
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我 们 知道 ， 在 IPv4 中 报 文 的 传输 分 为 三 种 方式 : 单 播 、 广 播 和 多 播 。 对 于 TCP 来 说 ， 
一 个 进程 通过 连接 与 另外 一 个 进程 进行 通信 ， 所 有 的 报 文 交互 的 都 是 单 播 方式 的 ， 不 存在 广 
播 和 多 播 的 概念 。 因 此 ， 对 于 用 户 进程 来 说 ， 只 有 通过 UDP 套 接口 才能 实现 广播 和 多 播 。 


19.2.1 报 文 的 发 送 


在 默认 情况 下 ，UDP 套 接口 是 无 法 发 送 广 播报 文 的 ， 在 19.1.1 节 介 绍 过 套 接口 启用 / 禁 
止 广播 是 通过 SOL_SOCKET 一 SO_BROADCAST 选项 来 完成 的 。 通 过 下 面 的 代码 段 ， 可 以 
确认 广播 选项 是 默认 关闭 的 。 


BOOL bBroadcast; 
int optlen = sizeof (bBroadcast) ; 
if (getsockopt (sock, SOL SOCKET, SO BROADCAST, (char *) & bBroadcast, &optlen) 
== SOCKET ERROR)( 
HandleError ("getsockopt") ; 
closesocket (sock) ; 
WSACleanup () + 
return -1; 
} 
if (bBroadcast) 
printf ("Broadcast enabled default!\n"); 
else 
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printf("Broadcast disabled default!\n"); 


程序 输出 “Broadcast disabled default! ”。 因 此 ， 要 发 送 广播 报 文 ， 必 须 首 先 启用 
SO_BROADCAST 选项 ， 如 下 : 


bBroadcast = true; 
optlen = sizeof (bBroadcast) ; 
if (setsockopt (sock, SOL SOCKET, SO BROADCAST, (char *) &bBroadcast, optlen) 
== SOCKET ERROR) { 
HandleError ("setsockopt"); 
closesocket (sock) ; 
WSACleanup(); 
return -1; 


) 


此 时 仍然 可 以 调用 getsockopt 函数 检查 是 否 设置 成 功 , 在 成 功 地 启用 了 SO BROADCAST 
就 可 以 发 送 广播 报 文 了 《〈 和 否则 sendto 函数 会 返回 10013 错误 ， 即 WSAEACCES) : 


m 


struct sockaddr in addr; 

memset(&addr, 0, sizeof (addr)); 

addr.sin addr.s addr = INADDR BROADCAST;// inet addr("202.119.9.255"); 
addr.sin family - AF INET; 

addr.sin port - htons(9999); 


const char *msg - "Hello! Broadcast Test!"; 
int len = strlen (msg); 


if(sendto(sock, msg, len, 0, (struct sockaddr *) &addr, sizeof(addr)) -- 
SOCKET ERROR) { 
HandleError ("sendto"); 
closesocket (sock) ; 
WSACleanup(); 
return -1; 


) 


其 中 INADDR BROADCAST 是 Winsock 定义 的 常量 0xffffffff， 对 应 于 受 限 广播 地 址 
255.255.255.255。 在 测试 时 ， 我 们 发 现 一 个 奇怪 的 现象 ， 当 不 使 用 受 限 广播 地 址 ， 而 是 使 用 
指向 网 络 的 广播 地 址 202.119.9.255 时 〈 见 代码 斜体 部 分 ) ， 无 论 SO BROADCAST 选项 处 
于 启用 还 是 禁止 状态 ， 报 文 均 能 被 广播 出 去 。 

另外 一 个 问题 是 ， 在 发 送 广播 报 文 时 需要 注意 UDP 数据 报 的 大 小 限制 。 源 自 Berkeley 
的 内 核 不 允许 广播 数据 报 被 分 片 ， 但 是 在 笔者 的 Windows 2000 系统 中 不 存在 这 个 问题 。 为 
了 测试 Windows 2000 对 大 UDP 报 文 的 处 理 , 把 msg 定义 为 一 个 2000 个 字 节 的 数组 、len 赋 
值 为 2000， 调 用 sendto 函数 后 ， 同 在 202.119.9 网 段 的 另 一 台 主 机 上 的 网 络 监视 器 返回 的 结 
果 如 图 19.1 和 图 19.2 所 示 。 

可 以 看 到 ， 事 实 上 接收 端 收 到 两 个 报 文 : 1472 字 节 应 用 数据 的 UDP 报 文 和 528 个 字 节 
的 下 分 片 报 文 。 而 在 运行 下 一 节 提 到 的 接收 程序 时 ， 应 用 进程 能 直接 收 到 重组 后 的 2000 F 


i UDP 数据 (recvfrom 返回 数值 2000) 。 


Fie Edk Caplue Display Tools Help 


Dactination 


第 19 章 


套 接口 选项 


44 6.151071 202.119.9.70 202.119.9.255 
4: 6.750718  922333c3. 00604 ceeoLes 00000000. FFFFrrfrrrTF 
a 202.119.9.70 


AITERM lE» 
119.9.27e20» 
ES 


Hane query Nb 
Find name 202 
Nane query Nb 


7.021323 z02.119.9.199 Fragmented 1P protocol 《prctO-LOP OxiL, off. 
49 7.407775 Realteks 4d:0a:oF AP who has 202.119.9.1? Tell 202.119,9,39 
50 7.410288 922353c3.0050ba67eF5c 922333c3fffFfffFFfFF TPX SAP General Response 
51 7.546246 Foundryn_09:eb:55 ”Spanning-tres-ffor-br STP Conf. Root - 8192/00:02:7a:46:14:30 Cost = 14 Port = Ox 
52 7.570937 92233353-00e04ce40165 00000000. FFfFFFFFFFFF Find nare 202.119. 9.27<20> 
53 7.647471 Z01.119.9.70 202.119. 3.255 mane query NE arTEaN<IE> 
$4 7.743963 202,129.0,112 202.119. 9.255 Hame query NB WORKGROUP de» 
55 7.744039 Intel_a8:29:2b Broadcast who has 202. .112? Tel] 202.119.9.136 
28 7.744142 D-Link. A6 boca who has 202.219.9112? doz 19. 933 
57 7.744185 Intol_O4zaazc6 Who has 202.119.9.1122 202.119.945 
18 7.744201 thn 98:06:06 Who has 202.119.9.1127 202.119. 9.153 
So 7.744217 Ibe 98:e9:07 Who has 202:119.9.1127 202.119.9.245 
60 7.744233 D-Ljnk-27:dFic7 Who has 202.119.9.112? 202,119.9.77 
G1 7.744248 xircom BF 32245 who has 202:319,9. 27 202.119.9.205 
62 7.744200 Reaiteks 45:ec:57 Who has 202.119.9.1127 202:119. 9:31 
63 7.744305 Ibn .tbi$15 Who has 202.119.9. 112? 202.119.9.2 
a 7.744320 bmn-5h:5a:2 Broadcast whà has 202.112.9112? 202.119.. 245 
$5 7.744335 ITEN 94130:03 Who has 202.119.9.112? 202.119.915 
66 7.744378 S Who has 202.219.9.2? 202.119.9:213 
Ear Minn haz poz Jla a 1192 tor aaa 1 
z 
[B Frawe 47 (1514 bytes on wire, 1514 bytes captured) 
m etnernar IL, Sre! 90:02:33:98:0a:7c, Det 他 :FT:TP2fFfFarT 
|3 Internet Protocol, Src Addr: 202.119. 9.199 (202.119.9.199), Dst Addr: 202.119.9.255 (202.119.9, 255) 
user paragran Fro 1605 (206), Dst 3899 C9909) 
020 05 FF 06 dC 27 OF 07 dB S045 FF 
REN 
Jace 
any 
c60 3 
Far "A eset] po Pate Wate), 1472 Estes 
图 19.1 UDP 广播 报 文 A 
@ <capture) - Ethereal PE 
Fie Edi Capture Oisplay Toos Hep | 


Salle Salse] 


Source 


44 6.151071 202.110.0.70 202.119.9.255. Wana query NB AITCAMdlb» 
45 5.750716 922333c3.00004ce40165 00000000. FFFFFFFFFT Find rame 202.119.9.27<20> 
46 6.893126 202.119.9.70 202.119.9. Mane query NB AITEAM<LO> 
47 7.010226 1202.119.9.199 202.119.9. Source port: 1606 Destination port: 9999 
49 7.407773 Realteks ¢d:0a:9f Broadcast ARP who has 202,119.9.1? Tell 202.119,9,39 
50 7.410288 922333c3.0030)a67ef3c 922333C3. fffffffffTT Lex sap General Response 
SL 7.586246 Foundryn 09:80:55  — spanring-tree-Cfor-hr ste Conf. ROOT = 8192/00:02:76:46:14:30 Cost = ld Port = Ox 
32 7.570937 “922333c3-00204Ce4016$ 0DOOCODD.**7fffffff*" NBIPX — Find rame 202.110.0.27c20» 
53 7.847471 202.119.9.70. 202.1190. 255 MONS mana query Wa ATTEaM<Lby 
S4 7.743963 202.119.9.112 202.119.9.255 MENS Mana cuery WB wORKGhOUP lg» 
55 7.744039 Intl a8:20:20 Broadcast aap who has 202.119.0.1122 Tel] 202.119.9.138 
56 7.244142. D-Link 66:b0:c Broadcast AnP who has 202.119.0.1227 Tcl] 202.110.0.151 
57 7.744185 Broadcast ARP who has 202.119.9.112? Tel] 202.119.9.43 
58 7.744201 Broadcast aap who has 202.119.9.1122 Tel] 202.119.9.153 
59 7.744217 Broadcast ARP who has 202.119.9.112? Tel] 202.119.9.245 
60 7.744233 D-Līnk_27:dF:c7 Broadcast ARP who has 202.119.9.112? Tel] 202.119.9.7? 
61 7.744248 xlrcum 8f:32:45 Broadcast ARP who has 202.119.9.112? Tel] 202.119.9.205 
82 7.744290 Realteks_45:8c:57 Broadcast age Who has 202.119.9.112? Tel] 202.119.9.3 
63 7.744305 rom_5b:19:10 Broadcast arp who has 202.119.6.1127 Tel] 202.119.9.222 
Bd 7.744320 Tbm_Sb:sa:20 Broad anp Who has 202.119.9112? Tel) 202.110.9.245 
65 7.744338. Intal_94:ab:03 Broadcast age who has 202.119.6.1127 Tel] 202.119.9.15 
66 7.744378 Intal_a8:2a:5c Broadcast aap who has 202.119.9.112? Tell 202.119.9.213 "| 
E? 7 AMAIN Daalrebe 446.m proaccasT Ao thn has Jn? 119 0 1122 Tel] On? 119 0 0 
后 T zj 
Berane 48 (962 bytes on wire, 352 bytes 
Ecthernet II, src: 00:02:55:98:0a:7c, pst: 
E Internet Protocol, sec Addr: 202.110.9.199 (202.119.9.19), Det Addr: 202.119.9.255 (202.110.9.255) 
T 
im] 
4 


Æ 19.2 


| eset] apply Pata aa), SE ee 
UDP 广播 报 文 B 


TCP/IP 协议 及 网 络 编程 技术 


由 此 可 以 得 出 结论 ，Windows 2000 系统 允许 广播 数据 报 分 片 , 因此 广播 报 文 可 以 大 于 外 
出 接口 的 MTU。 但 是 , 如 果 需 要 考虑 程序 的 可 移植 性 , 广播 应 用 系统 应 该 将 报 文 限制 在 1472 
字 节 以 内 。 


19.2.2 ”广播 报 文 的 接收 


接收 广播 报 文 不 需要 任何 额外 的 设置 ， 创 建 UDP 套 接 口 后 ， 绑 定 所 需 的 端口 即 可 ， 以 
上 面 的 发 送 程序 为 例 ， 接 收 方程 序 段 如 下 : 


SOCKET sock = socket (AF_INET, SOCK_DGRAM, 0); 
struct sockaddr_in addr; 

memset (&addr, 0, sizeof (addr) ); 

addr.sin_family = AF_INET; 

addr.sin port = htons (9999); 

addr.sin_addr.s_addr = INADDR_ANY; 

bind (sock, (struct sockaddr *) &addr, sizeof (addr) ); 


int ret; 
char buf[5000]; 
while(1) { 
ret = recvfrom(sock, buf, 5000, 0, NULL, NULL); 
if(ret == SOCKET_ERROR) { 
printf ("recvfrom: %d\n", WSAGetLastError()); 
break; 
) 
else 
printf("recvd $d bytes\n", ret); 
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设计 报 文 广播 方式 的 最 初 的 目的 是 用 于 资源 发 现 和 减少 数据 交互 量 。 但 事实 上 ， 由 于 报 
文 广播 时 , 同一 网 段 内 的 所 有 主机 , 无论 有 没有 参与 广播 应 用 ， 都 必须 完成 对 数据 报 的 处 理 。 
被 广播 的 UDP 报 文 会 被 接收 主机 的 系统 协议 栈 逐 层 处 理 ， 直 到 传输 层 将 其 交付 监听 相应 端 
口 的 应 用 进程 或 者 丢弃 。 因 此 ， 频 繁 的 大 数据 量 的 报 文 广播 会 严重 影响 网 络 上 的 其 他 主机 的 
正常 运行 。 而 多 播 方式 在 具有 广播 的 优点 的 同时 ， 很 好 地 解决 了 这 个 问题 。 

多 播 编程 涉及 到 19.1.2 WHER IP. HDRINCL 之 外 的 所 有 选项 , 我 们 已 经 介绍 了 这 些 选项 
的 基本 功能 ， 下 面 直 接 给 出 应 用 这 些 选 项 的 简单 的 lib 库 。” 


”出 于 与 伯克利 套 接口 的 兼容 性 考虑 ， 此 处 对 多 播 的 介绍 基于 Winsock 1 版 本 ， 不 涉及 Winsock 2 版 本 中 的 
相关 函数 。 


19.3.1 
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一 个 简单 的 多 播 库 


多 播 库 头 文件 如 下 : 


JOCOEOOOOOIOOOOOGOOIOOORGOROOOOeooek FIRE 9 2. 及 XJXXOOOOOOOOOOOOOOOOIR IIR Ie 


#ifndef _MCASTLIB_H_ 
#define MCASTLIBH 1 


#include <WinSock2.h> 
#include <WS2tcpip.h> 


#ifdef cplusplus 
extern "C" ( 
#endif 


int 
int 
int 
int 
int 
int 
int 
int 


mc_join(SOCKET s, struct in_addr *mcaddr, struct in_addr *local_if); 
mc_setIF (SOCKET s, const DWORD local out if); 

mc getIF(SOCKET s, DWORD *local out if); 

mc setTTL(SOCKET s, const DWORD ttl); 

mc getTTL(SOCKET s, DWORD *ttl); 

mc setLoop(SOCKET s, const BOOL flag); 

mc getLoop(SOCKET s, BOOL *flag); 

mc leave(SOCKET s, struct in addr *mcaddr, struct in addr *local if); 


#ifdef cplusplus 


} 


#endif 
#endif 


Ok ek KR Ke RO JOE ROO RO RO ROC RO ORARIO KORG OR OR AGAR RR TCI ICI TO TISAI tee 


多 播 库 的 具体 实现 如 下 : 


XOCOCOOOOHOIOOGOOIOOOOOoeeeoeoeooek TET. 2. B. JXOOOOOOOOOOOOOROORGIOOIOOOIOOROROIGOR 


#include "MCastLib.h" 
// 本 地 接口 local_if 加 入 多 播 组 mcaddr 


int 


{ 


mc_join(SOCKET s, struct in_addr *mcaddr, struct in_addr *local_if) 


struct ip mreq mreq; 

memcpy(&(mreq.imr interface), local if, sizeof (struct in addr));// local 
if 

memcpy(&(mreq.imr multiaddr), mcaddr, sizeof (struct in addr));// 
mutilcast group address 


return(setsockopt(s, IPPROTO IP, IP ADD MEMBERSHIP, (char *) &mreq, 
sizeof (mreq))); 


// 为 多 播报 文 设置 外 出 接口 


int 


mc_setIF (SOCKET s, const DWORD local_out_if) 
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return(setsockopt (s, IPPROTO_IP, IP MULTICAST IF, (char*) &local out if, 
sizeof(local out if))); 


// 获取 多 播报 文 的 外 出 接口 

int mc getIF(SOCKET s, DWORD *local_out_if) 

t 
int len = sizeof (DWORD); 
return(getsockopt(s, IPPROTO IP, IP MULTICAST IF, (char *) local out if, 
&len)); 


// 设置 外 出 多 播报 文 的 tt1 值 ， 默 认为 1 

int mc setTTL(SOCKET s, const DWORD ttl) 

t 
return(setsockopt(s,  IPPROTO IP, IP MULTICAST TTL, (char *) &ttl, 
sizeof (ttl))); 


// 获取 外 出 多 播报 文 的 ttl 值 
int mc getTTL(SOCKET s, DWORD *ttl) 
{ 
int len = sizeof (DWORD); 
return (getsockopt(s, IPPROTO IP, IP MULTICAST TTL, (char *) ttl, &len)); 


// 启用 或 者 禁止 多 播报 文 环 回 

int mc setLoop(SOCKET s, const BOOL flag) 

{ 
return(setsockopt(s, IPPROTO IP, IP MULTICAST LOOP, (char *) &flag, 
sizeof(flag))); 


// 获取 本 地 多 播 环 回 状态 
int mc getLoop(SOCKET s, BOOL *flag) 
{ 
int len = sizeof (BOOL); 
return (getsockopt (s, IPPROTO IP, IP MULTICAST LOOP, (char *) flag, &len)); 


// 本 地 接口 local_if 离 开 多 播 组 mcaddr 
int mc leave(SOCKET s, struct in_addr *mcaddr, struct in_addr *local_if) 
t 
struct ip mreq mreq; 
memcpy(&(mreq.imr interface), local if, sizeof (struct in addr));// local 
if 
memcpy(&(mreq.imr multiaddr), mcaddr, sizeof (struct in_addr));// 
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mutilcast group address 


return(setsockopt(s, IPPROTO IP, IP DROP MEMBERSHIP, (char *) é&mreq, 
sizeof (mreq))); 


} 


SIO III ICI III IO II E TOI TCI TOR II TOA TIO TOI AOA TA ek ek ak 


19.3.2 ”接收 多 播 数据 


加 入 多 播 组 并 接收 多 播 数据 ， 我 们 所 要 做 的 工作 可 能 比 大 部 分 人 想象 的 都 要 简单 : 创建 
一 个 UDP 套 接 口 ， 绑 定 本 地 端口 ， 调 用 上 一 节 中 的 me join 函数 加 入 相应 的 多 播 组 ， 然 后 就 
可 以 接收 数据 了 。 加 入 多 播 组 是 要 告诉 本 机 的 TP. 层 和 数据 链 路 层 接收 发 送 到 这 个 组 的 多 播 数 
ig; 捆绑 端口 则 是 向 UDP 层 通 告 该 应 用 程序 希望 接收 发 送 到 此 端口 的 数据 报 。 一 个 简单 的 
例子 如 下 : 


struct sockaddr in local; 

memset (&local, 0, sizeof(local)); 

local.sin_family = AF_INET; 

local.sin port = htons (9999); 

local.sin addr.s addr = inet addr("202.119.9.199"); 

// 815E«202.119.9.199, 9999» 

if (bind (sock, (struct sockaddr *) &local, sizeof(local)) == SOCKET ERROR)( 
printf("bind: %d\n", WSAGetLastError()); 

) 

// 202.119.9.199]1A £1821226.1.2.3, «226.1.2.3, 9999» 

struct in addr mcaddr; 

mcaddr.s addr - inet addr("226.1.2.3"); 

if(mc join(sock, &mcaddr, &(local.sin addr)) == SOCKET ERROR)( 
printf("Join Multicast Group: %d\n", WSAGetLastError()); 

) 

// 接收 数据 ， 考 虑 此 时 能 收 到 发 往 哪些 目的 地 址 的 UDP 报 文 

char buf[65]; 


while(1) { 
memset (buf, 0, 65); 
if(recvfrom(sock, buf, 64, 0, NULL, NULL) == SOCKET_ERROR) { 
printf ("recvfrom: %d", WSAGetLastError()); 
break; 
} 
else 


printf("recvd: %s\n", buf); 
$ 


上 述 的 代码 使 套 接口 sock 加 入 多 播 组 226.1.2.3, 并 接收 发 往 该 组 的 数据 。 打开 网 络 监视 
器 会 发 现 ， 当 调用 mc join 函数 加 入 多 播 组 时 ， 内 核 会 自动 向 该 组 发 送 一 个 “IGMP v2 
Memebership Report” 报 文 ， 该 报 文 会 被 组 内 的 所 有 主机 以 及 路 由 器 接收 。 这 也 就 是 系统 在 
后 台 为 该 调用 所 作 的 工作 之 一 。 如 图 19.3 所 示 。 
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91 19 00 


6 Gh oL $3 
ooze 00 02 $3 98 Qe fc Do 0€ 22 S6 og 33 db o0 Ge Go 
0030 00 00 00 00 C0 00 0000 00 CO 00 DO 


Fre] A Ree Appi || Fa vacas dat 
19.3 加 入 多 播 组 


在 加 入 了 多 播 组 之 后 ， 就 可 以 像 一 般 的 UDP 应 用 程序 那样 来 进行 报 文 的 接收 工作 了 。 
但 是 , 可 以 想象 ,在 执行 了 上 述 代 码 加 入 了 226.1.2.3 多 播 组 后 ,程序 不 仅 会 接收 到 所 有 的 发 
送 到 <226.1.2.3, 9999> 地 址 的 报 文 , 还 会 收 到 发 往 <202.119.9.199, 9999> 的 报 文 。 在 某 些 UNIX 
系统 中 ， 可 以 采用 将 套 接口 绑 定 到 多 播 系统 所 使 用 的 多 播 地 址 上 的 方法 来 使 内 核 自动 将 非 多 
播报 文 过 滤 掉 。 但 是 在 Winsock 中 ， 这 种 地 址 绑 定 是 不 允许 的 〈bind 会 报 10049 错误 ， 
WSAEADDRNOTAVAIL) ， 必 须根 据 报 文 的 源 地 址 或 者 应 用 层 数据 来 进行 过 滤 。 

在 套 接口 关闭 时 ， 无 论 有 没有 显 式 地 调用 mc leave 函数 ， 进 程 都 会 离开 多 播 组 ， 如 图 
19.4 所 示 。 如 果 此 时 本 机 没有 其 他 进程 加 入 了 该 组 , 那么 内 核 将 向 224.0.0.2 (所 有 路 由 器 组 ) 
发 送 “IGMP v2 Leave Group” 报 文 。 


19.3.3 发 送 多 播 数据 


如 果 不 关 心 多 播 出 口 、TTL 值 和 多 播 环 回 的 问题 ， 那 么 向 一 个 多 播 组 发 送 数据 是 非常 简 
单 的 ， 只 需要 像 普通 的 UDP 报 文 发 送 那样 调用 sendto 函数 ， 惟 一 的 差别 是 目标 地 址 是 多 播 
组 地 址 。 

但 是 ， 如 果 需 要 对 多 播 属性 进行 更 改 ， 如 TTL 值 (TTL 值 的 设置 对 大 部 分 多 播 应 用 系 
统 来 说 是 必需 的 ) ， 那 么 必须 在 调用 sendto 函数 之 前 完成 相应 的 设置 。 如 表 19.1 所 示 。 

下 面 的 程序 段 读 取 了 多 播报 文 的 默认 TTL 值 和 环 回 状态 ， 在 将 TTL 值 改 为 219 后 ， 向 
多 播 组 226.1.2.3 发 送 了 数据 “Hello! ”。 


to 
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Y? Membership Report 
Cisco Group Management Protocol 
54528 > 1300 [PSH, ACK] Seq-1906357708 Ack-3238840005 win-t 
1399 > $4528 [acc] Seq-3238840005 Ack-1906357878 win-54503 
Genera] Response 
General response 
Hane query Nb woaxcnouaie> 
202.119.9.2257 Tell 202.119.9.95 


phoenix 
922333c3, DOe0ac0Daf54 
522333c5. 0050ba67ef 5€ 92. 


fffffFFFfFEF 
Dol0fccl5658 00000000. fFFFFFFFFFFF NEIPX 
1220256 202.115,9. 110 202.119.3.255 NENS — Mame Query NB WORKGROUPCLC> 7 
a Spx,O)JY,,oF,Ho!s 
[a Frane 30 (60 Bytes a 
[a Ethernet it, src: 00 
[B rrternet Protocol, 
Header langrh: 20 bytes 
&odffarant^ared Services Field: DwcO (DSCP 0x30: Class selector 6; ECH: 0x00) 
Total Length: 28 
Identification: 0x25f7 (9719) 
5 


03 
St Adde: 226.1.2.3 (226. 


n 


67 de 08 
ca 77 05 
但 DI 
iso 03 60 bo 00 00 00 00 06 09 00 00 00 


E TREE 


194 离开 多 播 组 


表 19.1 多 播 TTL 值 
TTL Hifü 描述 


0 Restricted to the same host 
Restricted to the same subnet 
32 Restricted to the same site 

64 Restricted to the same region 
128 Restricted to the same continent 
255 Unrestricted in scop 


SOCKET sock = socket (AF_INET, SOCK DGRAM, 0); 

// 获取 默认 的 多 播报 文 TTL 值 和 环 回 状态 

DWORD ttl; 

if (mc_getTTL (sock, &ttl) SOCKET_ERROR) { 
printf("mc getTTL: %d\n", WSAGetLastError()); 


} 
BOOL loop; 
if (mc_getLoop(sock, &loop) == SOCKET_ERROR) { 


printf ("mc_getLoop: %d\n", WSAGetLastError()); 
} 
printf ("Multicast default: TTL = %d, LoopBack = %d\n", ttl, loop); 
// 设置 多 播 TTL 值 为 219 
ttl = 219; 
if (mc_setTTL(sock, ttl) 


= SOCKET ERROR) { 
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printf("mc getTTL: %d\n", WSAGetLastError()); 
} 
// 向 多 播 组 226.1.2.3 发 送 数据 
struct sockaddr_in to; 
memset (&to, 0, sizeof(to)); 
to.sin addr.S un.S addr = inet addr("226.1.2.3"); 
to.sin family = AF INET; 
to.sin port = htons (9999); 
char *buf - "Hello 
int res sendto(sock, buf, 6, 0, (struct sockaddr *) &to, sizeof(to)); 
if (res SOCKET ERROR) { 

HandleError ("sendto"); 


; 


[] 


) 


else 


printf ("Send out %d bytes!\n", res); 


由 图 19.5 可 以 发 现 ， 程 序 成 功 地 向 多 播 组 226.1.2.3 发 送 了 数据 “Hello! " , EH ER 
HOCH TTL 值 已 被 设置 为 219。 


Sou Protocol [mb 


Cost - 14 Port - Ox 


819365 707.119, 9.108. Nane query HS UTIAD<20> 


300.21 


B 
30 2; 848978 202.119. Nino query NB ADAX<20> 
40 2.972973 Cisco roadcast ARP who has 202.119.9.143° Tell 202.119.9.1 
41 3.145099 202.119. 202.119.9.255 vens 
42 318640 Cs Broidcast ARP 
43 3.406914 202. 202.319.9,255 Nons 
dà 3.453863 Cis E come cisco Group Management Protocol 
45 3.974063 202.119.9.198 202.219.9.255 BROWSER Request armouncament DecROUP 
4€ 3.574892 202.119,9.198 202.219. EROWEER Host Announcement DEGROWP, workstation, server, SQL Server, 
47 3.575129 202.119.9.125 202.119. BROWSER Local Master Armouncenent DDSROUP, workstation, Server, sal 
46 3.509505 202.119.9.744 meus nane query ms aDAx<20y 
493. 2 BROWSER Request Announcement ADAMP 
503. BROwSER Local Master Arnouncenert ADAX, workstation, server, NT wai]; 
一 = 二 
[S Ethernet I1, sre: 00:02: :0ai7€, Ost: C1:00:5e:01:02:03 B 
[a internet Priracoi， f phasnik QUA.I19.9.144), DSE Adde: 226.2.2.3 (226.1.2.3) 
Version: 4 
Header length: 20 bytes 
motfferentlatei services Fteld: oxo0 Cosce Cx00: pefau]:: ecw: 0100) 
Total Length: 34 
Identification: 0x95d7 (36359) 
国 Flags; 0x00 
Fragrant offset: D 
SOE 
UDP C011) 
cksum: S100 (correct) 
Source: phoenix (202.119.9.100) 
Destination: 226.1.2.3 (226.1.2.3) 
[musar baragram protocol, src Fort: 2662 (2662), pst Port: 8909 (aoas) 
Data (6 bytes) 


R 


[XOU Ul DO se Gl OF Ui Go 07 33 98 Da 7c Ge OD 23 OO 
oio Go 22 es cz 09 00 M 11 at boca 77 C9 cr ez or 
[uzo 02 03 oa 88 27 OF GO oe f2 26 48 41 8c &- BF 21 


Lu A] Reset] Apis] fime to we Get). 1 byte 
1955 发送 多 播报 文 


Sm 


19.4 原始 套 接口 编程 


原始 套 接口 (SOCK_RAW) 向 程序 设计 人 员 提 供 了 读 写 IP/ICMP/IGMP 以 及 构造 特殊 的 
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卫 报 文 的 功能 。 结 合 套 接口 选项 了 HDRINCL 的 使 用 ， 可 以 实现 一 些 网 络 诊断 、 测 试 程序 。 
使 用 原始 套 接口 的 基本 步骤 如 下 : 
(1) EL AF INET + SOCK RAW+IPPROTO XXX 为 参数 创建 原始 套 接口 ， 如 下 : 


SOCKET sock = socket (AF_INET, SOCK RAW, protocol); 


其 中 protocol 为 IPPROTO XXX 形 的 协议 名 常量 ， 如 IPPROTO ICMP 等 ， 一 般 不 能 设 
为 0。 
(2) 按照 需要 选择 是 否 设置 P_HDRINCL 选项 。 
G) 如 果 调 用 了 bind 函数 ， 那 么 内 核 会 将 绑 定 的 地 址 作为 输出 报 文 的 源 地 址 ， 绑 定时 
的 端口 号 对 原始 套 接口 没有 任何 意义 ， 如果 调 用 了 connect 函数 ， 那 么 只 有 来 自 被 connect 
的 地 址 的 报 文才 会 被 内 核 交 付 给 原始 套 接口 (对 connect 函数 应 用 于 无 连接 套 接口 的 讨论 见 
17.6.6 节 ) 。 一 般 情 况 下 ， 原 始 套 接口 不 调用 bind 和 connect 函数 。 
(4) 组 装 数据 ， 如 果 未 启用 IP_HDRINCL， 那 么 应 用 进程 只 需 构造 他 头 之 外 的 数据 ; 
否则 需要 提供 他 头 , 但 是 其 中 的 IPv4 标志 字段 与 头 部 校 验 和 可 以 留 给 内 核 填充 。 在 人 P 头 之 
外 的 数据 ， 如 果 需 要 有 校 验 和 《例如 ICMP) ， 那 么 必须 由 应 用 进程 计算 并 提供 。 
(5) 调用 发 送 函 数 ， 如 sendto 发 送 数据 。 需 要 注意 的 是 ,在 IP_HDRINCL 选项 启用 时 
(如 果 示 启用， 那么 内 核 会 将 sendto 的 目标 地 址 自动 填充 在 IP 头 的 目的 TP 地 址 字段 ) ， 如 
果 sendto 中 的 目标 地 址 参数 to 与 所 填充 的 IP 报头 中 的 目的 地 址 字段 不 同 ， 那 么 应 用 程序 不 
能 正常 工作 。 为 何不 能 正常 工作 ? 用 下 一 节 中 ping 程序 来 做 一 个 试验 : 在 构造 IP 报头 时 填 
入 202.119.9.242 的 目的 地 址 ， 在 调用 sendto 时 to 参数 设 为 202.119.9.99， 截 获 的 报 文 如 图 
19.6 所 示 。 


El 
File Edit Capture Display Tools Help 


D enl le Sela Jo IE ox] 3 


ima. . [Time Sauce [Destivation Pracco [vic 
EH for-be STe. 


E 7] Ress] cen Eram Gi Ta yu 
图 19.6 IP HDRINCL 选项 的 测试 
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需要 注意 的 是 ， 在 图 19.6 中 hqzhai EPL (EP 202.119.9:242) 的 MAC 地 址 为 
00:40:05:43:55:e6 。 那 么 实际 情况 是 怎么 样 的 呢 ? 首先 使 用 Windows 的 ping 命令 : ping 
202.119.9.242 / ping 202.119.9.99; 然后 输入 命令 arp -a， 查 看 到 的 正确 的 IP-MAC 对 应 表 如 
图 19.7 所 示 。 


[7 
90-48 
80-06 


ings Al 


图 19.7 真实 的 MAC 地 址 


我 们 可 以 看 出 ， 在 这 种 情况 下 应 用 进程 产生 的 数据 帧 中 的 MAC 地 址 是 to 地 址 对 应 的 
MAC 地 址 ， 而 目标 IP 地 址 是 填充 的 IP 头 的 数据 ， 两 者 不 匹配 。 这 也 就 是 此 时 程序 不 能 正常 
工作 的 原因 。 

(6) 调用 接收 函数 如 recvfrom 接收 数据 。 只 有 ICMP、IGMP 以 及 内 核 不 能 识别 协议 字 
段 的 他 数据 报 会 被 传递 给 原始 套 接口 。 
下 面 两 节 以 两 个 实用 程序 来 介绍 原始 套 接口 的 使 用 。 


19.4.4 Ping 程序 


ping 程序 是 典型 的 原始 套 接口 的 应 用 例子 , 通过 它 可 以 了 解 了 _HDRINCL 选项 的 使 用 和 
如 何 组 装 IP. ICMP 报头 。 程 序 的 基本 流程 如 下 : 
(1) BL AF INET、SOCK RAW fil IPPROTO ICMP 为 参数 创建 原始 套 接口 。 
(2) 启用 IP_HDRINCL 选项 。 
G) Fg ÉL OUI IP 头 及 ICMP 报 文 ， 需 要 注意 的 是 ICMP 报 文 的 校 验 和 必须 由 应 用 进 
程 计算 并 提供 。 
(4) 发 送 ICMP Echo 报 文 ， 并 和 解析、 显示 返回 的 ICMP Echo Reply RX. 


doe eeeoeeeeoeeoeeoeooeoe 程序 19.3. Ping CCC GGG ESE OGIO IORI A Ia ae 


T #pragma comment (lib, "ws2_32.lib") 


#include <STDIO.H> 
#include <WINSOCK2.H> 
#include <WS2TCPIP.H> 


on wn 


#include <PROCESS.H> 


6  // The IP header 
7 typedef struct iphdr ( 


8 unsigned char ver hlen; // version & length of the header 


30 


31 
32 


33 
34 
35 
36 


37 
38 
39 
40 
41 
42 
43 
44 


unsigned 


unsigned 


unsigned 
unsigned 
unsigned 
unsigned 
unsigned 
unsigned 
unsigned 
)IPHeader; 


char 


short 


short 
short 
char 
char 
short 
int 
int 


tos; 
total_len; 


ident; 
frag_and_flags; 
EtL 

proto; 
checksum; 
sourceIP; 
destIP; 


// ICMP header structure 
typedef struct icmphdr 


{ 
unsigned 
unsigned 
unsigned 
unsigned 
unsigned 
) ICMPHeader; 


char 
char 
short 
short 
short 


type; 
code; 
cksum; 
id; 
seq; 


#define ICMP ECHO REPLY 
#define ICMP ECHO REQUEST 


#define PACKAGE SIZE 


#define xmalloc(s) 


#define xfree(p) 


void usage(); 


// 
// 


HH 
// 
hf 
// 
nt 
// 
Tf 
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Type of service, 8 位 
total length of the packet, 16 


unique identifier, 16 f% 
flags, 16 fi 

8 位 

protocol (TCP, UDP etc)，8 位 
IP checksum, 16 位 

32 位 ， 源 IP 地 址 

32 位 ， 目 的 IP 地 址 


sizeof(IPHeader) + sizeof (ICMPHeader) 


HeapAlloc(GetProcessHeap(), HEAP ZERO MEMORY, (s)) 
HeapFree (GetProcessHeap(), 0, (p)) 


void HandleError(char *); 
void FillPackage(char *, unsigned long, u short); 
USHORT CheckSum(USHORT *, int); 


int main(int argc, char* argv[]) 


{ 


unsigned long dstIP; 
BOOL bBroadcast = false; 


if(argc == 2){ 


dstIP = inet_addr(argv[1]); 


if (dstIP == INADDR_NONE) { 


usage () ; 
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45 return -1; 

46 b 

47 } 

48 else 

49 if (argc == 3){ 

50 if (strcmp (argv[1], "-b") != 0){ 

51 usage () 7 

52 return -1; 

53 } 

54 bBroadcast = true; 

55 dstIP = inet_addr(argv[2]); 

56 if(dstIP == INADDR_NONE) { 

57 usage (); 

58 return -1; 

59 } 

60 } 

61 else{// argc != 2, 3 

62 usage (); 

63 return -17 

64 } 

65 int pid = _getpid(); 

66 WSAData wsaData; 

67 WSAStartup(WINSOCK VERSION, &wsaData) ; 

68 SOCKET sock = socket (AF_INET, SOCK RAW, IPPROTO ICMP); 

69 if (sock == INVALID_SOCKET) { 

70 HandleError ("socket") ; 

71 WSACleanup () ; 

72 return -1; 

73 } 

74 BOOL on = TRUE; 

735 if(setsockopt (sock, IPPROTO IP, IP HDRINCL, (char *) &on, sizeof (on) 
== SOCKET ERROR) { 

76 HandleError ("setsockopt") ; 

77 WSACleanup(); 

78 return -1; 

79 } 

80 

81 struct sockaddr in to, from; 

82 memset (&to, 0, sizeof (to)); 


83 to.sin addr.s addr = dstIP; 
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84 to.sin_family = AF_INET; 

85 int len - sizeof(to); 

86 // 此 处 应 尽量 不 调用 malloc， 当 用 malloc 分 配 内 存 ， 然 后 调用 socket API 

87 // 如 sendto 时 会 报 10004 错误 ， 即 该 调用 被 系统 中 断 〈 由 malloc 引起 ) 

88 char *buf = (char *) xmalloc(PACKAGE SIZE); 

89 

90 struct timeval tv; 

91 fd_set readSet; 

92 BOOL bError = false; 

93 for(int i = 0; i < 3 && !bError; i++){ 

94 printf ("ping $s ... %d\n", inet ntoa(to.sin addr), i*1); 

95 FillPackage(buf, dstIP, (u short) pid); 

96 if(sendto(sock, buf, PACKAGE SIZE, 0, (struct sockaddr *) &to, 
len) == SOCKET ERROR)( 

97 HandleError ("sendto") ; 

98 break; 

99 } 

100 while (1) { 

101 tv.tv_sec = 3; 

102 tv.tv_usec = 0; 

103 FD ZERO (&readSet) ; 

104 FD SET(sock, &readSet); 

105 int res = select(sock + 1, &readSet, NULL, NULL, &tv); 

106 if(res -- SOCKET ERROR)( 

107 HandleError ("select"); 

108 bError - true; 

109 break; 

110 } 

112 if (res 0)t 

112 if(!bBroadcast) 

113 printf ("time out!\n"); 

114 break; 

15 } 

116 

117 if (FD_ISSET (sock, &readSet))( 

118 memset (buf, 0, PACKAGE SIZE); 

119 memset (&from, 0, sizeof(from)); 

120 len = sizeof (from); 


1213 if(recvfrom(sock, buf, PACKAGE SIZE,0, (struct 
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122 
123 
124 
125 


126 
127 


128 
129 
130 
131 


132 
133 
134 
135 
136 
137 
138 


139 
140 


141 
142 


143 
144 
145 


146 
147 
148 
149 
150 


151 
152 
153 
154 
155 


void 


sockaddr *) &from, &len) SOCKET_ERROR) { 
HandleError ("recvfrom") 7 
bError = true; 


break; 


IPHeader *pIPHdr = (IPHeader *) buf; 
ICMPHeader *pICMPHdr = (ICMPHeader *) (buf + 
sizeof (IPHeader) ); 
if (pICMPHdr->id == htons((u short) pid) 
&& pICMPHdr->seq == htons((u_short) pid) 
&& pICMPHdr->type == ICMP_ECHO_REPLY) { 
printf ("Echo Reply From %s.\n", 
inet ntoa(from.sin addr)); 
if(!bBroadcast) break; 


) 
)// end of while 
)// end of for 


xfree (buf); 


closesocket (sock) ; 
WSACleanup(); 


return 0; 


FillPackage(char *pData, unsigned long dstIP, u short id) 
memset(pData, 0, PACKAGE SIZE); 
IPHeader* pIPHeader- (IPHeader*) pData; 


int nVersion - 4; 

int nHeadSize = sizeof(IPHeader) / 4; 

unsigned long srcIp = inet_addr ("202.119.9.199");// 此 处 不 能 使 用 
INADDR_ANY; 

unsigned long destIp = dstIP; 

plPHeader->ver_hlen = (nVersion << 4) | nHeadSize; 

pIPHeader-»tos = 0; 

pIPHeader-»total len = htons(PACKAGE SIZE); 

pIPHeader-»ident = htons (1234); 


156 
157 
158 
159 
160 
161 
162 
163 


164 
165 
166 
167 
168 
169 
170 


LE 
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pIPHeader-»frag and flags = 0; 

pIPHeader-»ttl - 255; 

pIPHeader-»proto = IPPROTO ICMP; 263 ) 
pIPHeader-»checksum = 0; 

pIPHeader-»sourceIP = srcIp; 

pIPHeader-»destIP = destIp; 

/* the below can be ignored */ 

pIPHeader-»checksum = CheckSum((USHORT*) pData, sizeof (IPHeader)); 


ICMPHeader* pICMPHeader-(ICMPHeader*) (pData + sizeof (IPHeader) ); 

pICMPHeader-»type = ICMP ECHO REQUEST; 

pICMPHeader-»code = 0; 

pICMPHeader->cksum = 0; 

pICMPHeader-»id = htons (id); 

pICMPHeader-»seq = htons (id); 

pICMPHeader->cksum = CheckSum((USHORT*) ((char*)pData + sizeof 
(IPHeader)), sizeof (ICMPHeader)); 


172 USHORT CheckSum(USHORT *pUShort, int size) 


173 { 
174 


175 
176 
177 
178 
179 
180 
181 
182 
183 
184 


185 
186 } 


187 void 
188 { 
189 

190 

191 } 


unsigned long cksum=0; 


while (size > 1) 
{ 
cksum += *pUShort++; 
size -= sizeof (USHORT); 
} 
if (size) {// size 1 
cksum += * (UCHAR*) pUShort; 


P 
cksum = (cksum >> 16) + (cksum & Oxffff); 


cksum += (cksum >>16); 


return (USHORT) (~cksum) ; 


usage () 


printf("usage: ping [-b] hostIP\n"); 
printf("notes: WẸ ping 广播 地 址 必须 加 -b, 否则 无 法 得 到 完整 输出 . \n") ; 
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192 void HandleError(char *func) 


193 { 

194 int errCode = WSAGetLastError(); 

195 char info[65] = {0}; 

196 _snprintf (info, 64, "%s: $d\n", func, errCode); 
197 printf (info); 


198 } 


eR oko joke jeje dock kj KR ok JR KO KR KK CK KORR KR KK RR KR KO KK KO KK KO KORG ROO KO 


第 6 一 18 TEXT IP 报 文 头 结构 IPHeader. 

第 19—27 行 定义 了 ICMP 报 文 头 结构 ICMPHeader。 

第 28 一 29 行 定 义 了 两 个 常量 ICMP_ECHO_REPLY fil ICMP_ECHO_REQUEST, 分 别 对 

应 ping 的 应 答 报 文 和 ping 的 请 求 报 文 。 

第 39—64 行 读 取 ping 程序 的 输入 参数 ,包含 目标 地 址 dstIP 和 “-b” 广 播 标 志 bBroadcast。 

第 65 行 获取 当前 进程 的 ID 号 ， 并 将 其 赋值 给 pid. 

第 66 一 67 行 初始 化 winsock。 

第 68 一 73 行 创建 ICMP 协议 类 型 的 原始 套 接口 。 

第 74 一 79 行 调用 setsockopt 函数 ， 启 用 IP HDRINCL 选项 。 

第 93 一 136 行 连续 发 送 三 次 ping 请 求 报 文 ， 并 输出 其 接收 到 的 应 答 。 

O 95~99 行 ， 调 用 FillPackage 填充 ICMP 报 文 ， 然 后 将 其 发 送 。 

O 100—135 行 ，while(1) 循 环 ， 用 于 接收 返回 的 应 答 报 文 。 之 所 以 需要 在 循环 体内 接 
收报 文 , 是 因为 本 程序 在 设置 -b 输入 参数 后 就 可 以 向 全 网 段 发 送 ping 请 求 报 文 , 一 
次 请 求 能 得 到 多 个 应 答 报 文 。 

+ 101~115 行 ， 应 用 select 模型 进行 读 操作 。 当 select 超时 说 明 不 再 有 响应 报 文 时 ， 
退出 while 循环 。 

+ 107—134 行 ， 解析 数据 ， 并 输出 确认 为 ICMP 应 答 的 报 文 。 

第 138 一 141 行 释放 资源 ， 结 束 winsock 的 使 用 并 退出 程序 。 

第 143—171 行 FillPackage 函数 ， 根 据 输入 的 目标 IP 和 进程 号 参数 ， 组 装 ping 请 求 

报 文 。 
第 172—186 行 CheckSum 函数 ， 计 算 报 文 的 校 验 值 。 


19.4.2 WinSniffer 程序 


WinSniffer 是 一 个 简单 的 网 络 监视 器 原型 ， 用 于 演示 原始 套 接口 和 WSAloctl 函数 中 
SIO RCVALL 选项 的 使 用 。 运 行 该 程序 后 ， 将 以 “协议 名 From 源 地 址 ”的 格式 输出 本 机 指 
定 网 络 接口 上 接收 到 的 所 有 报 文 。 

WSAloctl HAVE ioctlsocket, setsockopt/getsockopt 之 外 的 另 一 个 套 接口 模式 /选项 配置 
函数 ， 用 于 设置 或 者 读 取 套 接口 上 的 操作 选项 参数 。 函 数 定义 如 下 : 


int WSAIoctl( 
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SOCKET s, 

DWORD dwIoControlCode, 

LPVOID lpvInBuffer, 

DWORD cbInBuffer, 

LPVOID lpvOutBuffer, 

DWORD cbOutBuffer, 

LPDWORD lpcbBytesReturned, 

LPWSAOVERLAPPED lpOverlapped, 

LPWSAOVERLAPPED COMPLETION ROUTINE lpCompletionRoutine 
) 


其 中 s 表示 待 处 理 的 套 接口 对 象 , dwIoControlCode 为 控制 码 ; IpvInBuffer 是 输入 缓冲 区 
指针 ,可 能 是 布尔 型 、 整 型 ,也 可 能 是 结构 体 与 dwIoControlCode 对 应 ;cbInBuffer 是 lpvInBuffer 
的 大 小 字 节 数 ; lpvOutBuffer 是 输出 缓冲 区 ; cbOutBuffer 是 IpvOutBuffer 的 大 小 ; 
lpcbBytesReturned 用 于 保存 实际 的 输出 字 节 数 ， lpOverlapped 和 IpCompletionRoutine 仅 用 于 
重 县 套 接口 ， 分 别 指向 重 又 结构 和 完成 例 程 。 

从 Windows 2000 起 ，Winsock2 新 增 了 很 多 WSAloctl 操作 码 如 SIO_RCVALL、SIO_ 
RCVALL_MCAST, SIO_RCVALL_IGMPMCAST, SIO_KEEPALIVE_VALS, SIO ABSORB 
_RTRALERT, SIO_UCAST_IF, SIO LIMIT BROADCASTS, SIO INDEX BIND, SIO_ 
INDEX MCASTIF, SIO INDEX ADD MCAST, SIO INDEX DEL MCAST. WinSniffer 应 
用 了 其 中 的 SIO_RCVALL 选项 ， 使 套 接口 可 接收 流 经 本 地 指定 网 络 接口 的 所 有 IP 报 文 。 该 
选项 只 适用 于 AF INET 地 址 族 + 原 始 套 接口 HIPPROTO IP 协议 ， 并 且 套 接口 必须 明确 指定 
需 绑 定 的 本 地 网 络 接口 ， 也 就 是 说 不 能 使 用 通 配 网 址 INADDR_ANY。 

程序 的 基本 流程 是 : 

(D 以 AF_INET、SOCK_RAW fil IPPROTO IP 为 参数 创建 原始 套 接口 。 

(2) 绑 定 本 地 地 址 202.119.9.199。 

G) 调用 WSAloctl 设置 SIO RCVALL 为 TRUE. 

(D 接收 、 解 析 报 文 并 输出 分 析 结 果 ; 需要 注意 的 是 ， 由 于 我 们 只 关心 卫 报头 ， 程 序 
只 分 配 了 很 小 的 缓冲 区 ， 因 此 在 接收 报 文 时 recvfrom 函数 返回 WSAEMSGSIZE 错误 是 完全 
正常 的 。 

由 于 程序 相对 较为 简单 ， 就 不 再 对 它 进行 详细 分 析 。 
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#pragma comment (lib, "ws2 32.lib") 


#include <STDIO.H> 
#include <WINSOCK2.H> 
#include <MSTcpIP.h> 


// The IP header 

typedef struct iphdr { 
unsigned char ver hlen; // version & length of the header 
unsigned char tos; // Type of service, 8 位 
unsigned short total len; // total length of the packet, 16 位 
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unsigned short ident; // unique identifier, 16 位 
unsigned short frag and flags; // flags, 16 位 
unsigned char ttl; // 8 位 
unsigned char proto; // protocol (TCP, UDP etc), 8 位 
unsigned short checksum; // IP checksum, 16 位 
unsigned intsourceIP; // 32 位 ， 源 IP 地 址 
unsigned intdestIP; // 32 位 ， 目 的 IP 地 址 
)IPHeader; 


#define PACKAGE SIZE sizeof (IPHeader) 
#define xmalloc(s) HeapAlloc (GetProcessHeap(), HEAP ZERO MEMORY, (s)) 
#define xfree(p) HeapFree (GetProcessHeap(), 0, (p)) 


BOOL WINAPI CtrlHandler(DWORD dwEvent) ; 
void HandleError (char *); 


BOOL g_bExit = FALSE; 


int main(int argc, char* argv[]) 
{ 
if(!SetConsoleCtrlHandler(CtrlHandler, TRUE) ) { 
printf ("SetConsoleCtrlHandler: %d\n", GetLastError()); 
return -1; 


WSAData wsaData; 
WSAStartup (WINSOCK_VERSION, &wsaData) ; 
SOCKET sock = socket (AF_INET, SOCK RAW, IPPROTO IP); 
if (sock == INVALID_SOCKET) { 
HandleError ("socket") ; 
WSACleanup(); 
return -1; 


struct sockaddr in addr; 

memset(&addr, 0, sizeof(addr)); 

addr.sin addr.s addr - inet addr("202.119.9.199"); 

addr.sin family - AF INET; 

if (bind (sock, (struct sockaddr *) &addr, sizeof(addr)) == SOCKET ERROR)( 
HandleError ("bind"); 


int on = RCVALL ON; 
DWORD num; 
if(WSAIoctl(sock, SIO RCVALL, &on, sizeof (on), NULL, 0, &num, NULL, NULL) 
== SOCKET ERROR) { 
HandleError("WSAIoctl Set"); 
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char *buf = (char *) xmalloc(PACKAGE_SIZE); 


struct sockaddr_in from; " 
int fromlen; 


while(!g bExit)( 
memset (buf, 0, PACKAGE SIZE); 
memset(&from, 0, sizeof(from)); 
fromlen = sizeof (from); 
if (recvfrom(sock, buf, PACKAGE SIZE, 0, (struct sockaddr *) &from, &fromlen) 
== SOCKET_ERROR) { 
if (WSAGetLastError() != WSAEMSGSIZE) { 
HandleError ("recvfrom") ; 
break; 


switch(((IPHeader *) buf)->proto) { 

case IPPROTO_ICMP: 
printf("ICMP From %s\n", inet ntoa(from.sin addr)); 
break; 

case IPPROTO IGMP: 
printf("IGMP From %s\n", inet ntoa(from.sin addr)); 
break; 

case IPPROTO TCP: 
printf("TCP From $s\n", inet ntoa(from.sin addr)); 
break; 

case IPPROTO UDP: 
printf("UDP From %s\n", inet ntoa(from.sin addr)); 
break; 

default: 
printf ("UnKnown datagram From %s\n", inet ntoa(from.sin addr)); 


xfree (buf); 
closesocket (sock) ; 
WSACleanup(); 

printf ("Stopped!\n") ; 


return 0; 


BOOL WINAPI CtrlHandler (DWORD dwEvent) 


{ 


switch (dwEvent) { 
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case CTRL_C_EVENT: 

case CTRL_LOGOFF_EVENT: 
case CTRL_SHUTDOWN_EVENT: 
case CTRL CLOSE EVENT: 


printf ("Stopping...... Mn"); 
g bExit = TRUE; 
break; 
default: 
return FALSE; 
} 
return TRUE; 
} 
void HandleError(char *func) 
{ 
int errCode = WSAGetLastError(); 
char info[65] = {0}; 
_snprintf(info, 64, "%s: d\n", func, errCode) ; 
printf (info); 
} 
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相对 于 服务 器 端 编程 而 言 ， 客 户 端的 程序 设计 比较 简单 ， 因 此 本 书 以 服务 器 编程 介绍 为 
主 。 从 第 20 章 起 ， 我 们 讨论 几 种 常见 的 UDP/TCP 服务 器 的 系统 架构 设计 ， 并 对 其 进行 性 能 
分 析 。 在 介绍 具体 的 服务 器 设计 之 前 ， 首 先 在 20.1 节 简 单 地 介绍 多 线程 编程 的 基本 知识 ,在 
此 基础 上 分 别 介绍 迭代 UDP 服务器、 并 发 UDP 服务 器 、 和 迭代 TCP 服务 器 和 并 发 服务 器 的 设 
计 方 法 。 


20.1 多 线程 编程 


需要 指出 的 是 ， 本 书 的 主要 目标 是 介绍 Winsock 网 络 编程 知识 ， 多 线程 编程 只 是 网 络 编 
程 的 辅助 技术 , 因此 我 们 并 不 打算 加 以 详细 的 介绍 。 20.1 节 仅仅 告诉 读者 如 何 创建 一 个 线程 ， 
以 及 如 何 进行 简单 的 线程 同步 。 


20.1.1 线程 的 创建 
Windows API 提供 了 多 个 函数 接口 以 创建 线程 ， 本 书 首先 介绍 其 中 的 _beginthread 函数 。 


unsigned long _beginthread( void( _ cdecl *start address )( void * ), 
unsigned stack size, 
void *arglist ); 


start address: 输入 参数 ， 待 创建 的 新 线程 所 要 执行 的 工作 函数 的 起 始 地 址 。 

stack size: 输入 参数 ， 新 线程 的 栈 的 大 小 ， 也 可 以 设置 为 0。 

arglist: 需要 传递 给 新 线程 的 参数 列表 ， 可 以 为 NULL。 

BA: 如 果 线 程 创 建成 功 ， 函 数 返回 新 创建 线程 的 句柄 ; 否则 返回 -1， 此 时 系统 
会 自动 设置 ermo ffi. 

使 用 _beginthread 函数 创建 线程 是 非常 简便 的 。 首 先 定义 一 个 工作 线程 函数 ， 原 型 如 下 : 


void WorkThread(LPVOID lpParam); 

该 函数 的 返回 值 必须 是 void。 所 有 的 线程 工作 函数 都 有 一 个 32 位 的 输入 参数 ， 应 用 程 
序 可 以 用 它 来 传递 数值 ， 如 accept 返回 的 SOCKET 变量 (本 质 上 是 u_int 类 型 ) ， 但 更 多 地 
是 传递 一 个 指向 结构 体 的 指针 。 随 后 ， 我 们 就 可 以 创建 线程 了 : 


HANDLE hThread = (HANDLE) beginthread (WorkThread, 0, hIOCP); 


如 果 创建 线程 成 功 ， 函 数 会 返回 新 线程 的 句柄 。 
我 们 可 以 调用 _endthread 函数 来 结束 线程 ， 但 是 一 般 不 需要 这 人 么 做 : 当 线程 函数 执行 完 


aoon 
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毕 时 会 自动 调用 该 函数 。_endthread 函数 会 释放 线程 占用 的 资源 并 自动 关闭 线程 句柄 ， 因 此 
必须 牢记 : 对 于 _beginthread 函数 创建 的 线程 , 不 要 调用 CloseHandle 函数 来 关闭 返回 的 句柄 。 
这 一 点 与 第 21 章 介绍 到 的 CreateThread 函数 有 所 不 同 。 


20.1.2 ”线程 的 同步 


Windows 向 程序 设计 人 员 提 供 了 多 种 线程 同步 方法 ， 如 mutex、semaphore、 事 件 对 象 以 

及 临界 区 对 象 等 ， 本 节 介 绍 其 中 的 两 种 。 
(1) 事件 对 象 CEvent Objects) 机 制 

Win32 应 用 程序 可 以 使 用 事件 对 象 机 制 来 通知 等 待 线程 某 个 条 件 已 满足 。 以 一 个 简单 的 
例子 来 说 明 这 种 机 制 的 应 用 : 假设 有 三 个 线程 一 一 主线 程 、ReadThread 和 WriteThread， 同 
步 要 求 是 ReadThread 必须 在 WriteThread 的 写 操作 完成 之 后 才能 进行 读 操作 ， 主 线程 必须 在 
ReadThread 的 读 操 作 完成 后 才 结 束 。 

定义 两 个 事件 对 象 evToRead 和 evToFin, 前 者 由 WriteThread 用 于 通知 ReadThread 进行 
读 操作 ， 后 者 由 ReadThread 用 于 通知 主线 程 读 操作 结束 。 事 件 对 象 的 创建 、 设 置 及 等 待 可 参 
见 18.2.3 节 介 绍 。 图 20.1 是 线程 同步 的 示意 图 。 


创建 evToRead 

和 evToFin 事件 
对 象 

创建 ReadThread 

和 WriteThread 

《自动 执行 ) 


触发 evToRead 


触发 evToFin 


图 20.1 线程 同步 要 求 
程序 实现 如 下 : 


JGOOOOOOOOOOOoeeeeoeeoeeeeeeee* 程序 D0 。 SyncEvent J499  ÁD!xad  GOHOOOOOROOeeer 


#pragma comment (lib, "ws2 32.1lib") 


#include <STDIO.H> 
#include <PROCESS.H> 
#include <WINSOCK2.H> 
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WSAEVENT evToRead, evToFin; 


void ReadThread(LPVOID param) 

{ 
WSAWaitForMultipleEvents(1, &evToRead, TRUE, WSA INFINITE, FALSE); 
printf ("Reading...\n"); 
for(int i = 9; i >= 0; i--){ 


printf ("%x 
Sleep (500); 


i); 


) 
printf ("\nRead Finished! Wn"); 
WSASetEvent (evToFin); 
) 
void WriteThread(LPVOID param) 
{ 
printf ("Writing...\n"); 
for(int i =0; i < 10; i++){ 
printf("$x ", i); 
Sleep(500); 
) 
printf ("\nWrite Finished! Wn"); 
WSASetEvent (evToRead) ; 


int main(int argc, char* argv[]) 
{ 
printf ("Main Start ->\n"); 
evToRead = WSACreateEvent (); 
evToFin = WSACreateEvent (); 
_beginthread(ReadThread, 0, NULL); 
.beginthread(WriteThread, 0, NULL); 
WSAWaitForMultipleEvents(1, &evToFin, TRUE, WSA_INFINITE, FALSE); 
printf ("<-Main Finnish\n"); 


return 0; 


} 
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程序 的 输出 如 图 20.2 所 示 。 


My Documents X 25, €TCPIP 55498487) \Code\ Syncévent\Release) 


图 20.2 SyncEvent 输出 
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(2) 临界 区 对 象 〈Critical Section Objects) 机 制 
另 一 种 简单 并 且 常 用 的 线程 同步 机 制 是 临界 区 对 象 。 与 事件 对 象 相 比 ， 临 界 区 更 适用 于 
多 个 线程 操作 之 间 没 有 先后 顺序 但 要 求 互 斥 的 同步 。 
要 使 用 临界 区 对 象 机 制 ， 首 先 必须 定义 CRITICAL. SECTION 变量 ， 该 变量 是 所 有 临界 
区 操作 的 对 象 。 
CRITICAL SECTION CS; 
定义 了 变量 CS 之 后 ， 在 实际 使 用 之 前 还 需要 调用 InitializeCriticalSection 对 CS 进行 初 


始 化 。 该 函数 只 有 一 个 输出 类 型 的 参数 LPCRITICAL SECTION， 没 有 返回 值 ， 但 是 在 内 存 
不 足 的 情况 下 会 抛 出 STATUS NO MEMORY 异常 。 


InitializeCriticalSection(&CS); 


初始 化 了 CS 之 后 , EnterCriticalSection, TryEnterCriticalSection 以 及 LeaveCriticalSection 
函数 就 可 以 为 多 个 线程 提供 共享 资源 的 互 斥 访问 了 。 当 线 程 调用 EnterCriticalSection 函数 时 ， 
系统 会 判断 CS 对 象 是 否 已 被 锁定 ， 如 果 没 有 被 锁定 ， 那 么 线程 就 可 以 进入 临界 区 以 进行 共 
享 资源 的 互 斥 访问 并 且 同 时 CS 被 置 为 锁定 状态 ， 和 否则， 说 明 有 线程 已 在 使 用 共享 资源 ， 调 
用 线程 将 被 阻塞 以 等 待 CS 解锁 。 如 果 线 程 不 希望 被 阻塞 而 只 是 想 尝试 进入 ， 那 么 可 以 调用 
TryEnterCriticalSection 函数 。 在 对 共享 资源 的 互 斥 访问 结束 后 ， 线 程 应 该 调用 
LeaveCriticalSection 函数 来 解锁 CS， 此 时 其 他 线程 中 就 能 进入 临界 区 了 。 


EnterCriticalSection(&CS) ; 
// Access the shared resource. 


// Release ownership of the critical section. 
LeaveCriticalSection(&CS); 


在 进程 中 的 各 线程 结束 同步 操作 后 , 进程 必须 调用 DeleteCriticalSection 函数 以 释放 系统 
资源 。 


DeleteCriticalSection (&CriticalSection) ; 
把 涉及 到 的 这 些 函 数 的 定义 列表 如 下 : 


VOID InitializeCriticalSection ( 

LPCRITICAL SECTION lpCriticalSection // critical section 
); 
BOOL TryEnterCriticalSection ( 

LPCRITICAL SECTION lpCriticalSection // critical section 
); 
VOID EnterCriticalSection( 

LPCRITICAL SECTION lpCriticalSection // critical section 
) 
VOID LeaveCriticalSection( 

LPCRITICAL SECTION lpCriticalSection  // critical section 
) 
VOID DeleteCriticalSection( 
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LPCRITICAL SECTION lpCriticalSection  // critical section 
Ys 


20.2 迭代 服务 器 


和 迭代 服务 器 的 设计 相对 于 并 发 服务 器 来 说 比较 简单 , 对 于 UDP 来 说 更 为 如 此 。 多 数 UDP 
服务 器 程序 都 是 迭代 执行 :服务 器 等 待 请 求 ， 接 受 请 求 ， 处 理 请 求 ， 送 回应 答 ， 然 后 再 次 等 
待 请 求 …… 典 型 的 例子 如 ECHO 服务 。 如 果 处 理 请 求 处 理 过 程 较为 复杂 ， 需 要 服务 器 一 客户 
端 之 间 的 多 次 交互 ， 那 么 在 此 交互 过 程 中 ， 所 有 来 自 不 同 源 地 址 的 报 文 都 将 被 丢弃 。 在 这 种 
架构 下 ， 服 务 器 应 注意 在 等 待 客户 端的 非 起 始 请 求 报 文 时 ， 应 进行 严格 的 超时 控制 ， 以 防止 
服务 器 长 期 地 停留 在 为 某 个 客户 端 服务 的 等 待 中 。 

给 出 一 个 服务 器 与 客户 端 之 间 需 要 两 步 数 据 交互 的 例子 ， 如 图 20.3 所 示 。 


服务 器 端 客户 端 


等 待 起 始 请 求 报 文 1 
全 一 


一 一 
请 求 处 理 ， 返 回应 答 


图 20.3 客户 一 服务 器 的 交互 


服务 器 运行 过 程 如 下 : @ 服务 器 等 待 起 始 请 求 报 文 1; @ 当 接收 到 报 文 1 后 ， 将 客户 
端的 源 地 址 一 端口 号 记录 在 案 ， 处 理 请 求 并 传 回应 答 ，@ 服务 器 等 待 客户 端的 反馈 报 文 2， 
如 果 超 时 ， 服 务 器 复位 ， 如 果 收 到 的 报 文 并 非 来 自 起 始 报 文 的 源 地 址 一 端口 ， 那 么 丢弃 该 报 
X (也 可 使 用 connect 函数 来 完成 这 个 功能 ) ; 否则 进入 步骤 @ 处 理 请 求 ， 返 回应 答 ; © 复 
位 ， 服 务 器 回 至 起 始 状态 。 


20.8 并 发 服务 器 


在 迭代 服务 器 的 介绍 中 提 到 ， 如 果 服 务 器 一 客户 端 之 间 的 交互 较为 复杂 ， 那 么 来 自 其 他 
客户 端的 请 求 就 会 被 丢弃 ， 这 在 某 些 应 用 情况 下 不 可 接受 到 ， 因 此 就 需要 用 到 并 发 服务 器 
设计 。 

典型 的 解决 方法 是 这 样 的 : 服务 器 等 待 起 始 的 请 求 报 文 ， 当 有 客户 服务 请 求 到 来 时 ， 创 
建 一 个 新 的 套 接口 ; 将 该 套 接 口 的 端口 号 作为 服务 器 的 第 一 个 应 答 ， 要 求 客户 端 随后 与 该 套 
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接口 交互 。 借鉴 TCP 服务 器 ， 把 服务 器 的 接受 请 求 的 套 接口 称 为 监听 套 接口 ， 而 把 创建 的 新 
套 接口 称 为 服务 套 接 口 ， 其 流程 如 图 20.4 所 示 。 


服务 器 〈 主 线程 客户 端 


等 待 初始 请 求 报 文 向 服务 器 监听 
端口 发 送 服务 


请 求 报 文 


创建 新 线程 ， 将 客户 端 地 
址 一 端口 作为 参数 传 入 


获得 服务 套 接 


创建 服务 套 接 口 ， 并 将 口 的 端口 号 


端口 号 通告 客户 端 


实际 的 服务 请 


maur 求 一 应 答 过 程 


接受 并 处 理 请 求 


图 20.4 并 发 UDP 服务 器 
一 个 简单 的 服务 器 程序 如 下 : 


TOO RA RRA RARE REAR 程序 20.2 UDPCOSVE XJ XX EERE RRR RE 


t #pragma comment (lib, "ws2 32.1lib") 


#include <STDIO.H> 
#include <TIME.H> 
#include <WINSOCK2.H> 
#include <PROCESS.H> 


Q ww 


6 typedef struct _UserDATA{ 


7 byte type; // 报 文 类 型 ，0: 初 始 请 求 1 :应 答 -ServerSocketaddress 2: 请 求 
3: 应 答 -echo 
8 char buf[500]; 


9 JUserData; 


10 void HandleError(char *func) 


AT..4 

12 #ifdef DEBUG 

13 int errCode = WSAGetLastError(); 
14 char info[65] = {0}; 


15 _snprintf (info, 64, "%s: $d\n", func, errCode); 


16 
17 


19 
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printf (info); 


#endif 


} 


void ServerThread(LPVOID param) 


{ 


time t tm; 
time (&tm) ; 


printf("Server Thread %d started.\n", tm); 


UserData data; 


struct sockaddr_in *fromaddr = (struct sockaddr_in *) param; 


SOCKET sockSvr = socket (AF_INET, SOCK_DGRAM, 0); 
if(sockSvr == INVALID_SOCKET) { 

HandleError ("socket") ; 

return; 


if (connect (sockSvr, (struct sockaddr *) fromaddr, 
sockaddr_in)) == SOCKET_ERROR) { 
HandleError ("connect") ; 
closesocket (sockSvr) ; 
return; 
} 


HeapFree (GetProcessHeap(), 0, fromaddr) ; 


// N&1 
memset (&data, 0, sizeof (data) ); 
data.type = 1; 


sizeof (struct 


// client can get the server socket address when recv the datagram 


if(send(sockSvr, (char *) &data, sizeof(data), 0) == 


HandleError ("send") ; 
closesocket (sockSvr) ; 
return; 

} 

// 请 求 2 

timeval tv; 

memset (&tv, 0, sizeof (tv)); 

tv.tv sec = 5; 

fd set readSet; 

FD ZERO(&readSet); 

FD SET(sockSvr, &readSet); 


SOCKET ERROR)( 
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53 int ret - select(0, &readSet, NULL, NULL, &tv); 

54 // CASE 1: select Error 

55 if(ret == SOCKET ERROR)( 

56 HandleError ("select"); 

57 closesocket (sockSvr); 

58 return; 

59 } 

60 // CASE 2: select Timeout 

61 if(ret == 0){ 

62 closesocket (sockSvr) ; 

63 printf ("Time over, server socket closed & thread %d finished!\n", tm); 

64 return; 

65 } 

66 // CASE 3: select OK 

67 if (FD_ISSET(sockSvr, &readSet)) { 

68 memset (&data, 0, sizeof (data) ); 

69 ret = recv(sockSvr, (char *) &data, sizeof(data), 0); 

70 if (ret == SOCKET ERROR)( 

71 HandleError ("recv") ; 

72 closesocket (sockSvr) ; 

73 return; 

74 } 

75 } 

76 else{ 

77 closesocket (sockSvr) ; 

78 return; 

79 } 

80 

81 if(data.type != 2){ 

82 printf ("Wrong Packet, Server socket closed & thread %d 
finished!\n", tm); 

83 closesocket (sockSvr) ; 

84 return; 

85 } 

86 // 应 答 3 - echo 

87 data.type = 3; 

88 send(sockSvr, (char *) &data, sizeof(data), 0); 

89 closesocket (sockSvr); 

90 printf ("Server Thread $d finished. Mn", tm); 


91 } 


100 
101 
102 


103 
104 
105 


106 
107 
108 
109 
110 


111 
112 
113 
114 


115 
116 
117 
118 
119 
120 
121 
122 
123 
124 
125 
126 
127 
128 
129 
130 
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int main(int argc, char* argv[]) 


{f 


WSAData wsaData; 
WSAStartup(WINSOCK VERSION, &wsaData); 
SOCKET sockListen = socket(AF INET, SOCK DGRAM, 0); 
struct sockaddr in listenaddr; 
memset(&listenaddr, 0, sizeof(listenaddr)); 
listenaddr.sin family - AF INET; 
listenaddr.sin port - htons(9999); 
listenaddr.sin addr.s addr = INADDR ANY; 
if(bind(sockListen, (struct sockaddr *) &listenaddr, 
sizeof(listenaddr)) == SOCKET ERROR)( 
HandleError ("bind"); 
return -1; 


UserData initReq; 
struct sockaddr in *from; 
int fromlen, ret; 
while(1)( 
from = (struct sockaddr in *) HeapAlloc (GetProcessHeap(), 
HEAP ZERO MEMORY, sizeof(struct sockaddr in)); 
memset(&initReq, 0, sizeof(initReq)); 
memset(from, 0, sizeof(struct sockaddr in)); 
fromlen - sizeof(struct sockaddr in); 
ret = recvfrom(sockListen, (char *) &initReq, sizeof(initReq), 
0, (struct sockaddr *) from, &fromlen); 
if(ret == SOCKET ERROR)( 
HandleError ("recvfrom"); 
break; 
} 


if(ret != sizeof (initReq) ) { 


#ifdef _DEBUG 


printf ("Wrong package! Discarded! Mn"); 


#endif 


continue;// discard 


} 
if(initReq.type != 0) { 


#ifdef DEBUG 


printf ("Wrong package type! Discarded!\n"); 


#endif 


continue;// discard 
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131 _beginthread(ServerThread, 0, from); 
132 } 

133 return 0; 

134 } 
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第 6—9 íT UserData 结构 定义 ， 其 中 type 域 用 于 指示 报 文 类 型 (0 表示 客户 端的 初始 请 

求 ，1 表示 服务 器 反馈 的 服务 套 接口 地 址 ，2 表示 客户 端 请 求 3 表示 服务 器 的 应 答 echo) ; 

buf 域 作为 数据 区 。 

58 92—134 ÍF main 函数 。 

O 94~96 行 ， 初 始 化 winsock， 并 创建 UDP 服务 器 套 接口 sockListen， 该 套 接口 将 用 
于 接收 所 有 的 客户 端 初始 请 求 报 文 。 

O 97—105 行 ， 将 服务 套 接口 绑 定 本 地 的 9999 端口 〈 该 端口 必须 是 客户 端 知道 的 )。 

O 109—132 行 ， 循 环 接收 来 自 各 个 客户 端的 初始 请 求 报 文 ， 并 将 客户 端的 地 址 作为 参 
数 创建 服务 线程 ServerThread。 

第 19 一 91 行 ServerThread 线程 函数 。 

口 “25 行 ， 根 据 线程 参数 param 获取 该 线程 所 有 服务 的 客户 端的 地 址 fomaddr。 

O 26—35 行 ， 为 该 客户 端 创建 服务 套 接 口 sockSvr， 并 调用 connect 函数 在 sockSvr 和 
客户 端 地 址 之 间 建 立 绑 定 关系 。 这 样 做 有 两 个 优点 : 一 是 避免 sockSvr 接收 到 非 该 
客户 端 地 址 的 UDP 报 文 ;二 是 可 以 直接 调用 send 和 recv 函数 ， 而 不 是 sendto 和 
recvfrom. 

O 36 行 ， 释放 fromaddr 所 占 资源 。 需 要 注意 的 是 ， 该 内 存 资源 在 主线 程 中 分 配 ， 在 
ServerThread 子 线程 中 被 释放 。 

O ”37 一 45 行 ， 发 送 应 答 报 文 (类 型 1)。 由 于 客户 端 在 调用 recvfrom 函数 时 可 以 获得 
服务 套 接口 的 地 址 ， 因 此 不 需要 显示 地 将 地 址 信息 填充 在 应 答 报 文中 。 

C) 46-85 行 ， 应 用 select 函数 接收 客户 端的 后 续 请 求 报 文 (类 型 2)， 并 进行 相应 的 报 
文 格式 判断 。 

口 、86~88 行 ， 服 务 套 接口 返回 应 答 报 文 (类 型 3)。 

O 899047, 关闭 服 务 套 接口 ， 并 结束 服务 线程 。 

相对 应 的 客户 端 程序 片断 如 下 ， 需 要 注意 的 是 这 些 代码 缺少 必要 的 错误 处 理 以 及 安全 考 

例如 接收 到 的 临时 服务 套 接口 的 IPv4 地 址 应 该 与 监听 套 接口 地 址 一 致 等 。 


È 


SOCKET sock = socket (AF_INET, SOCK_DGRAM, 0); 

struct sockaddr_in listenaddr, svraddr;// 分 别 对 应 服务 器 监听 套 接口 和 临时 服务 套 接 
口 地 址 

int len; 

memset (&listenaddr, 0, sizeof(listenaddr));// 监听 套 接口 地 址 

listenaddr.sin_family = AF_INET; 

listenaddr.sin port = htons (9999); 

listenaddr.sin_addr.s_ addr = inet_addr("202.119.9.199"); 
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UserData data; 

memset (&dqata，0，sizeof(dqata) )7 

data.type = 0;// 服务 请 求 起 始 报 文 

sendto(sock, (char *) &data, sizeof (data), 0, (struct sockaddr *) &listenaddr, 
sizeof (listenaddr) ); 

memset (&data, 0, sizeof (data)); 

len = sizeof (svraddr) ; 

recvfrom(sock, (char *) &data, sizeof(data), 0, (struct sockaddr *) &svraddr, 
&len); 

if(data.type == 1)(// 获取 了 临时 服务 套 接口 地 址 
printf("$s: %d\n", inet ntoa(svraddr.sin addr), ntohs(svraddr.sin_port)); 

H 

connect (sock, (struct sockaddr *) &svraddr, sizeof(svraddr)); 

memset (&data, 0, sizeof (data) ); 

data.type = 2;// 服务 请 求 报 文 

strncpy(data.buf, "Hello! It's only a test!", 500); 

send(sock, (char *) &data, sizeof(data), 0); 

memset (&data, 0, sizeof (data) ); 

recv(sock, (char *) &data, sizeof(data), 0);// 接收 服务 响应 -Echo 

if (data.type == 3){ 
printf ("Server Echo: %s\n", data.buf); 
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与 UDP 服务 器 编程 相 比 ，TCP 服务 器 编程 要 复杂 得 多 ,可 以 选择 的 系统 结构 设计 也 多 种 多 
样 。 本 章 首 先 简单 地 介绍 迭代 TCP 服务 器 ， 然 后 介绍 3 种 常用 的 并 发 TCP 服务 器 系统 设计 。 


21.1 和 迭代 服务 器 


迭代 TCP 服务 器 系统 结构 非常 简单 ， 它 的 基本 流程 如 下 : 
(1) 创建 监听 流 套 接口 。 

(2) 绑 定 本 地 的 服务 器 知名 端口 。 

(3) 调用 listen 函数 ， 使 套 接口 处 于 监听 状态 。 

(4) 接受 外 来 连接 请 求 ，accept 函数 返回 服务 套 接口 。 
(5) 与 客户 端 进行 数据 交互 。 

(6) 关闭 服务 套 接口 ， 返 回 步骤 (4) 。 关 闭 操作 可 能 由 以 下 的 任意 一 种 情况 引发 : 
O ”数据 交互 完毕 ， 服 务 器 主动 关闭 连接 。 

O “客户 端 已 关闭 连接 。 

口 ” 服 务 器 端 接收 数 据 超时 。 

如 图 21.1 所 示 为 迭代 TCP 服务 器 系统 流程 。 


创建 监听 流 套 接口 -socket 
v 
绑 定 服务 器 知名 端口 -bind 
¥ 创建 流 套 接 口 -socket 
监听 连接 请 求 -Histen 
Yy 
Y 向 监听 端口 发 起 连接 
m~~ 接受 连接 accept N -connect 
v v 
数据 交互 -Tecvsend — |. p 与 服务 套 接口 之 间 进 
行 所 需 的 数据 交互 
关闭 服务 套 接口 Yy 
~closesocket 关闭 连接 
-closesocket 


图 21.1 AR TOP 服务 器 系统 流程 


第 21 章 TCP 服务 器 编程 


和 迭代 服务 器 的 最 大 问题 是 它 无 法 处 理 多 个 、 同 时 发 生 的 客户 端 请 求 。 如 果 有 两 个 客户 同 
时 发 送 连接 请 求 ， 那 么 其 中 一 个 必须 等 待 直 到 另 一 个 请 求 处 理 完 毕 。 因 此 ， 和 迭代 服务 器 架构 
通常 只 能 用 于 一 些 简单 的 服务 类 型 ， 如 Echo、Ping 等 。 


212. 并 发 服务 器 


由 于 和 迭代 服务 器 的 种 种 局 限 性 ， 人 们 通常 采用 另 一 种 服务 器 架构 一 一 并 发 服务 器 。 它 与 
帮 代 服务 器 的 最 大 区 别 是 可 以 同时 处 理 多 个 客户 端的 请 求 。 


21.2.1 每 客户 单线 程 


在 一 般 的 并 发 服务 器 架构 中 ， 一 个 单独 的 线程 等 待 客户 端的 连接 请 求 ， 当 有 请 求 到 来 时 
该 线程 创建 一 个 新 的 服务 线程 来 进行 处 理 ， 在 新 线程 创建 完毕 后 主线 程 再 回复 至 等 待 请 求 状 
态 。 这 种 服务 器 架构 也 就 是 通常 说 的 每 客户 单线 程 模型 ， 如 图 21.2 所 示 。 


创建 监听 流 套 接口 
绑 定 服务 器 知名 端口 
-bind 
创建 流 套 接 口 PAN 创建 流 套 接口 
向 服务 器 监听 >| , x 向 服务 器 监听 
端口 发 起 连接 i ess : 端口 发 起 连接 
v 
以 accpet 返回 的 套 接口 
为 参数 ， 创 建 服务 线程 
与 服务 套 接口 a. mom 
H E si 
之 间 进 行 所 需 | 一 一 SORES | FERE e 之 问 进行 所 需 
的 数据 交互 I | 的 数据 交互 
Y 关闭 服务 关闭 服务 t 
关闭 连接 geo | "UU 套 接口 关闭 连接 
—closesocket —closesocket 
图 21.2 并 发 TCP 服务 器 一 每 客户 单线 程 模型 
基于 这 种 模型 的 服务 器 程序 流程 如 下 : 


(1) 创建 监听 流 套 接口 。 
(2) 绑 定 本 地 的 服务 器 知名 端口 。 
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(3) 调用 listen 函数 ， 使 套 接口 处 于 监听 状态 。 

(4) 接受 外 来 连接 请 求 ，accept 函数 返回 服务 套 接 口 。 

(5) 以 服务 套 接口 为 参数 ， 创 建 服务 线程 ， 主 线程 返回 步骤 (4) ; 同时， 服务 线程 进 
AFH. 

(6) 服务 线程 完成 客户 端的 服务 请 求 ， 关 闭 服 务 套 接口 并 结束 线程 。 

一 个 简单 的 Echo 服务 器 示例 如 程序 21.1 所 示 。 在 主线 程 中 ， 服 务 器 循环 调用 accept K 
数 以 接受 外 来 客户 端 连接 请 求 , 并 将 accept 返回 的 套 接口 sockAccept 作为 参数 创建 服务 线程 
WorkThread; 服务 线程 在 while(1) 循 环 中 接收 并 回放 客户 端 传 来 的 数据 ， 直 到 接收 操作 超时 
或 者 某 个 套 接口 函数 操作 失败 。 


diceieeeeeeeeeeeeeeeeoeee FIIE21.1 TCPServerA J4(ctxo99&x 9 UO In Ea ie 


#pragma comment (lib, "ws2 32.lib") 


#include <STDIO.H> 
#include <WINSOCK2.H> 
#include <PROCESS.H> 


void WorkThread(LPVOID lpParam) 
{ 
SOCKET sockSvr = (SOCKET) lpParam; 
fd set readSet; 
int ret; 
timeval tv; 
char buf[5000]; 


while (1)( 

FD ZERO(&readSet); 

FD SET(sockSvr, &readSet); 

tv.tv sec = 5; 

tv.tv usec - 0; 

ret - select(0, &readSet, NULL, NULL, &tv); 

if(ret == SOCKET ERROR || ret == 0){// Error or Timeout 
printf("Select error (%d) or Timeout!\n", WSAGetLastError()); 
break; 

) 

if(FD ISSET(sockSvr, &readSet))( 
memset(buf, 0, 5000); 
ret = recv(sockSvr, buf, 5000, 0); 


if(ret == SOCKET ERROR || ret == 0){// Error or Peer closed 
printf("recv error ($d) or Timeout!\n", WSAGetLastError()); 
break; 


} 
//printf ("Socket %d recv: %s\n", sockSvr, buf); 
ret = send(sockSvr, buf, strlen(buf), 0); 
if (ret == SOCKET ERROR) 
break; 
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closesocket (sockSvr) ; 


int main(int argc, char* argv[]) 


{ 


WSAData wsaData; 
WSAStartup (WINSOCK_VERSION, &wsaData); 


SOCKET sockListen = socket (AF_INET, SOCK STREAM, 0); 
BOOL bReuseAddr = true; 
setsockopt (sockListen, SOL SOCKET, SO REUSEADDR, (char *) &bReuseAddr, 
sizeof (bReuseAddr) ) ; 
struct sockaddr_in local; 
memset (&local, 0, sizeof(local)); 
local.sin_addr.s_addr = INADDR_ANY; 
local.sin_family = AF_INET; 
local.sin port = htons (9999); 
if(bind(sockListen, (struct sockaddr *) &local, sizeof(local)) == 
SOCKET_ERROR) { 
printf("bind: %d\n", WSAGetLastError()); 
closesocket (sockListen); 
WSACleanup(); 


return -1; 


if(listen(sockListen, 5) == SOCKET ERROR)( 
printf("listen: %d\n", WSAGetLastError()); 
closesocket (sockListen); 
WSACleanup(); 


return -1; 


SOCKET sockAccept; 
while (true) { 
sockAccept = accept(sockListen, NULL, NULL); 
if(sockAccept == INVALID SOCKET) 
break; 
else 
_beginthread(WorkThread, 0, (LPVOID) sockAccept); 


closesocket (sockListen); 
WSACleanup(); 
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return 0; 
} 
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21.2.2 ”线程 池 


事实 上 ， 早 期 的 服务 器 程序 采用 的 都 是 每 客户 单 进程 模型 ， 与 进程 相 比 ， 线 程 引起 的 系 
统 负荷 无 疑 要 小 多 了 ， 但 是 线程 的 创建 也 远 非 零 耗费 的 。 因 此 ， 在 实际 的 服务 器 开发 中 通常 
采用 在 应 用 进程 初始 化 时 预先 创建 多 个 工作 线程 即 线程 池 的 方法 来 避免 这 种 开销 。 


创建 监听 流 套 接口 
v 
绑 定 服务 器 知名 端口 
-bind 
v 
监听 -listen 
v 
以 监听 套 接口 为 参数 
创建 流 套 接口 a 创建 流 套 接 口 
i x 9 b" Y 
向 服务 器 监听 接受 连接 接受 连接 向 服务 器 监听 
端口 发 起 连接 [— — 其 accept accept [4—— | 端口 发 起 连接 
i Y Y Y 
与 服务 套 接口 数据 交互 | ...... 数据 交互 与 服务 套 接口 
之 间 进 行 所 需 同一 一 入 | -reevi/send -recv/send [4 —— —À*| 之 间 进 行 所 需 
的 数据 交互 I i 的 数据 交互 
i 关闭 服务 | .....。| 关闭 服务 i 
关闭 连接 套 接口 套 接口 关闭 连接 
~closesocket ~closesocket 


图 21.3 并 发 TCP 服务 器 一 线程 池 模型 


一 种 较为 简单 的 基于 线程 池 模型 的 服务 器 程序 流程 如 下 : 

(OD 创建 监听 流 套 接口 。 

(2) 绑 定 本 地 的 服务 器 知名 端口 。 

(3) 调用 listen 函数 ， 使 套 接口 处 于 监听 状态 。 

(4) 以 监听 套 接口 为 参数 创建 多 个 服务 线程 ， 主 线程 休眠 。 
服务 线程 的 流程 如 下 : 

(1) 接受 外 来 连接 请 求 ，accept 函数 返回 服务 套 接口 。 

(2) 处 理 客户 端 服务 的 请 求 ， 关 闭 服务 套 接口 ， 并 返回 步骤 (D 。 
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下 面 的 代码 演示 了 基于 线程 池 的 TCP 服务 器 模型 的 应 用 。 该 程序 完成 的 功能 与 程序 21.1 
基本 相同 ,但 从 结构 上 来 说 有 很 大 的 差别 。 主 线程 首先 创建 了 监听 套 接口 sock， 然 后 以 sock 
为 参数 创建 了 CO_THREAD_NUM 个 服务 线程 WorkThread, 随 后 主线 程 调用 Sleep 进入 休眠; 285 
服务 线程 有 两 个 while(1) 循 环 ,其 中 的 外 循环 接受 客户 端 连 接 , 内 循环 对 接受 的 连接 提供 Echo 
服务 。 


THOS OHO C SHOR OHO OHO oe TIIE21.2 TCPServerB UHH XO OOOOOOOOORORHOOO 


#pragma comment (lib, "ws2 32.1ib") 


#include <STDIO.H> 
#include <WINSOCK2.H> 
#include <PROCESS.H> 


#define CO THREAD NUM 24 


void WorkThread(LPVOID lpParam) 


t 
SOCKET sockListen - (SOCKET) lpParam; 


SOCKET sockSvr; 
fd set readSet; 
int ret; 
timeval tv; 
char buf[5000]; 
while (1)( 
sockSvr = accept(sockListen, NULL, NULL); 
if(sockSvr == INVALID_SOCKET) { 
printf ("accept: $dWMn", WSAGetLastError()); 
continue; 


while(1) { 

FD ZERO(&readSet); 

FD SET(sockSvr, &readSet); 

tv.tv sec = 5; 

tv.tv usec - 0; 

ret - select(0, &readSet, NULL, NULL, &tv); 

if(ret == SOCKET ERROR || ret == 0){// Error or Timeout 
printf ("Socket &d: Select error ($d) or Timeout! Wn", sockSvr, 
WSAGetLastError()); 
break; 

} 

if (FD_ISSET(sockSvr, &readSet) ) { 
memset (buf, 0, 5000); 
ret = recv(sockSvr, buf, 5000, 0); 
if (ret == SOCKET ERROR || ret == 0){// Error or Peer closed 

printf ("recv error (%d) or Peer closed!\n", WSAGetLastError ()); 
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break; 
} 
//printf ("Socket $d recv: %s\n", sockSvr, buf); 
ret = send(sockSvr, buf, strlen(buf), 0); 
if (ret == SOCKET ERROR) 
break; 


closesocket (sockSvr) ; 


int main(int argc, char* argv[]) 
{ 
WSAData wsaData; 
WSAStartup (WINSOCK_VERSION, &wsaData) 7 


SOCKET sock = socket (AF_INET, SOCK STREAM, 0); 


BOOL bReuseAddr = true; 


setsockopt (sock, SOL_SOCKET, SO_REUSEADDR, (char *) &bReuseAddr 
sizeof (bReuseAddr)); 


struct sockaddr_in local; 

memset (&local, 0, sizeof (local)); 

local.sin addr.s addr = INADDR_ANY; 

local.sin_family = AF_INET; 

local.sin port = htons (9999); 

if (bind (sock, (struct sockaddr *) &local, sizeof (local) ) == SOCKET ERROR) 
printf("bind: %d\n", WSAGetLastError()); 
closesocket (sock) ; 
WSACleanup(); 


return -1; 

if(listen(sock, 5) == SOCKET ERROR)( 
printf("listen: %d\n", WSAGetLastError()); 
closesocket (sock) ; 
WSACleanup(); 
return -1; 


for(int i = 0; i < CO THREAD NUM; i++) 
.beginthread(WorkThread, 0, (LPVOID) sock); 
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Sleep (INFINITE); 


closesocket (sock); 
WSACleanup(); 
return 0; 


} 


eK oko dede Kk ok KK Kk III ICICI ICI ICICI ICICI ICICI OK jejej ko jk Rok je TOA TA Ae 


21.23 IOCP 


线程 池 模型 的 缺点 是 为 了 能 同时 满足 多 个 客户 请 求 ， 不 管 什么 时 候 服 务 器 系统 中 都 必须 
有 一 定数 量 的 线程 数 在 运行 ， 但 是 由 于 系统 中 只 能 有 CPU 个 数 那么 多 个 线程 同时 处 于 运行 
态 (Running) ， 因 此 线程 池 中 同时 存在 很 多 工作 线程 并 没有 实际 意义 ， 相 反 由 于 几乎 所 有 
这 些 线程 均 处 于 可 运行 态 (Runnable) ，Windows 内 核 在 调度 处 于 运行 态 的 线程 时 引起 的 线 
程 上 下 文 的 切换 会 带 来 很 大 的 资源 耗费 。 为 了 解决 这 个 问题 , 并 同时 保留 线程 池 模型 的 优势 ， 
微软 设计 了 完成 端口 模型 ， 在 18.2.5 节 对 模型 本 身 已 经 进行 了 深入 的 分 析 ， 本 节 侧重 介绍 模 
型 的 应 用 。 

IOCP 服务 器 流程 如 图 21.4 所 示 ， 该 模型 的 使 用 过 程 大 体 如 下 : 

(1) 使 用 CreateloCompletionPort 函数 创建 完成 端口 ， 并 以 该 IO 完成 端口 为 参数 创建 
多 个 服务 线程 。 

(2) 创建 监听 套 接口 。 

G) 接受 客户 端 连接 请 求 ， 返 回 服务 套 接口 。 

(4) 将 服务 套 接口 与 完成 端口 绑 定 ， 并 在 该 套 接口 上 投递 初始 IO 操作 请 求 。 

(5) 返回 步骤 (3) 。 

服务 线程 的 流程 如 下 : 

(1) 调用 GetQueuedCompletionStatus 函数 等 待 获取 完成 信息 。 

(2) 根据 需要 对 数据 进行 处 理 并 投递 后 续 的 IO 操作 请 求 。 

GO BAAR CD 。 

在 给 出 IOCP 示例 程序 之 前 ， 先 介绍 另 一 组 线程 操作 函数 。 在 本 节 之 前 的 所 有 应 用 程序 
中 都 是 采用 _beginthread 函数 来 创建 线程 的 ， 事 实 上 ， 在 Win32 平台 下 用 的 更 多 的 是 
CreateThread 函数 。 该 函数 的 原型 如 下 : 


HANDLE CreateThread ( 
LPSECURITY ATTRIBUTES lpThreadAttributes, // SD 


DWORD dwStackSize, // initial stack size 
LPTHREAD START ROUTINE lpStartAddress, // thread function 
LPVOID lpParameter, // thread argument 
DWORD dwCreationFlags, // creation option 
LPDWORD lpThreadId // thread identifier 


ta 


其 中 IpThreadAttributes 用 于 指定 线程 的 安全 设置 ，dwStackSize 是 线程 栈 的 初始 大 小 ， 
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dwCreationFlags 用 于 设 定 创建 线程 时 的 额外 参数 ，IpThreadId 用 于 返回 生成 的 线程 ID， 其 余 
参数 与 beginthread 函数 一 致 。 因 此 ， 忽 略 多 余 的 参数 ， 下 面 两 行 代码 的 效果 是 一 样 的 。 


创建 Jo 完成 端口 
—CreateloCompletionPort 
A A 
以 该 VO 完成 端口 为 参数 创建 多 个 工作 线程 
v 
创建 监听 流 套 接口 
m = mm 
bind-listen 
v * y 0 
向 服务 器 监听 pum 向 服务 器 监听 端口 
端口 发 起 连接 太一 一 一 | 1 aT e Rete 
v 将 accpet 返回 的 套 接口 Y 
与 服务 套 接口 之 KIKE VO 完成 端口， 与 服务 套 接口 之 
间 进行 所 需 的 数 并 投递 初始 的 VO 操作 间 进行 所 需 的 数 
据 交互 —CreateloCompletionPort, 据 交 互 
WSARecv 
Y vy 
关闭 连接 关闭 连接 
-closesocket -closesocket 
gem 获取 Uo 完成 数据 报 。 | T 
we —GetQueuedCompletionStatus ^ SS 
P d i i 工作 线程 池 Em 
Pa 处 理 数据 、 给 出 反馈 ， 如 果 震 x 
/ 要 投递 新 的 VO 操作 x 
i N 
| i 
| 获取 IO 完成 数据 报 获取 VO 完成 数据 报 ! 
\ -GetQueuedCompletionstatus | “~ -GetQueuedCompletionStatus ] 
\ / 
\ 


rt 


处 理 数 据 、 给 出 反馈 ， 如 果 
需要 投递 新 的 VO 操作 


+ 1 


处 理 数据 、 给 出 反馈 ， 如 果 
需要 投递 新 的 VO 操作 


图 21.4 并 发 TCP 服务 器 一 IOCP 模型 
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_beginthread (WorkThread, 0, (LPVOID) sock) 
CreateThread(NULL, 0, WorkThread, sock, 0, NULL) ; 


这 里 需要 注意 两 者 的 区 别 。 

口 ” 当 线程 结束 时 ，beginthread 创建 的 线程 会 自动 调用 endthread 来 释放 所 有 的 资源 (不 
能 调用 CloseHandle 来 关闭 句柄 ); 而 CreateThread 线程 必须 显 式 地 调用 CloseHandle 
来 关闭 线程 的 句柄 。 

口 C 运 行 库 里 的 函数 如 printf 函数 ， 必 须 在 由 同属 于 C 运行 库 的 _begingthread 函数 创 
建 的 线程 中 使 用 ， 如 果 在 CreateThread 线程 中 使 用 这 些 C 运行 库 函 数 会 引起 内 存 
泄漏 。 

在 下 面 的 示例 程序 中 ， 希 望 主线 程 在 所 有 服务 线程 都 结束 的 情况 下 才 退 出 ， 这 就 需要 用 

到 另 一 个 线程 同步 的 函数 WaitForMultipleObjects, MAGE LMF: 


DWORD WaitForMultipleObjects ( 


DWORD nCount, // number of handles in array 
CONST HANDLE *lpHandles, // object-handle array 

BOOL fWaitAll, // wait option 

DWORD dwMilliseconds // time-out interval 


); 


其 中 的 被 等 待 的 对 象 可 以 是 Change notification, Console input, Event, Job, Mutex, 
Process、Semaphore、Thread、Waitable timer 等 。 对 于 CreateThread 创建 的 线程 ， 当 它 在 运 
行 时 ， 状 态 被 置 为 未 触发 ， 当 线程 结束 ， 状 态 被 置 为 已 触发 。 因 此 ， 假 设 hThreadHandles 数 
组 里 保存 了 所 有 的 服务 线程 句柄 ， 那 么 主线 程 与 这 些 线程 的 同步 代码 可 以 是 : 


WaitForMultipleObjects(nThreadCount, hThreadHandles, TRUE, dwMilliseconds) 
下 面 是 使 用 完成 端口 模型 的 TCP Echo 服务 器 程序 代码 : 


FECES EEO E SEES ESSE OES C FRE 27.3. IOCP ACHE ACHE CEES EIEIO Aa 


1 #pragma comment (lib, "ws2 32.lib") 


2 #include <STDIO.H> 

3 #include «WINSOCK2.H» 

4 #include «PROCESS.H» 

5  #define MAX THREAD NUM 24 


#define MAX BUF LEN 5000 


7 typedef enum IO OPER{ 

8 SVR_IO_READ, 
SVR_IO WRITE 

10 }IO OPER, *LPIO OPER; 


11 // JRHCBASEIA, S 1/0 数据 


23) 
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typedef struct _OverLappedEx{ 
OVERLAPPED OverLapped; 


WSABUF wbuf; 

char data[MAX BUF LEN]; 
IO OPER oper; 

DWORD flags; 


} PER IO DATA, *LPPER IO DATA; 
// 完成 键 结构 体 ， 单 句柄 数据 ， 对 应 每 个 服务 套 接口 一 每 个 连接 
typedef struct CONN CTX{ 
SOCKET sockAccept; 
LPPER IO DATA pPerIOData; 
struct CONN CTX *pPrec; 
struct CONN CTX *pNext; 
) CONN CTX, *LPCONN CTX; 


CRITICAL SECTION g CriticalSection; 
LPCONN CTX g_ptrConnCtxHead = NULL; // 双向 链表 ， 用 于 保存 服务 器 所 有 连接 信息 
SOCKET g_sockListen = INVALID_SOCKET; 


BOOL WINAPI CtrlHandler (DWORD dwEvent) ; 

// 完成 端口 操作 函数 

HANDLE CreateNewIoCompletionPort (DWORD dwNumberOfConcurrentThreads) ; 

BOOL AssociateWithIoCompletionPort (HANDLE hComPort, HANDLE hDevice, DWORD 
dwCompKey) ; 

// 创建 监听 套 接口 

SOCKET CreateListenSock(); 

// 创建 连接 数据 信息 

LPCONN CTX CreateConnCtx (SOCKET sockAccept, HANDLE hIOCP); 

void ConnListAdd (LPCONN CTX lpConnCtx); 

void ConnListRemove (LPCONN CTX lpConnCtx); 

void ConnListClear(); 


int myprintf (const char *lpFormat, ...); 
// 工作 线程 函数 
DWORD WINAPI WorkThread(LPVOID lpParam); 


int main(int argc, char* argv[]) 

{ 
HANDLE hIOCP = NULL; 
HANDLE hThreadHandles [MAX THREAD NUM]; 
int nThreadCount = 0; 


WSAData wsaData; 
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if (WSAStartup (WINSOCK VERSION, &wsaData) != 0){ 
myprintf ("Winsock initialized failed ...\n"); 


return -1; 


for(int i = 0; i < MAX_THREAD NUM; i++) 
hThreadHandles[i] = NULL; 


if (!SetConsoleCtrlHandler (CtrlHandler, TRUE) ) { 
myprintf ("SetConsoleCtrlHandler: %d\n", GetLastError()); 
return -1; 


InitializeCriticalSection (&g_CriticalSection) ; 


_try{ 
// 创建 IXo 完成 端口 
hIOCP = CreateNewIoCompletionPort (0) 7 
if(hIOCP == NULL) { 


myprintf ("CreateIoCompletionPort: %d\n", GetLastError()); 


__ leave; 


// 创建 多 个 工作 线程 
SYSTEM INFO sysInfo; 
GetSystemInfo (&sysInfo); 


// #$ sysInfo.dwNumberOfProcessors*2 fIMAX THREAD NUM 之 间 的 较 小 值 赋 给 


nThreadCount 


nThreadCount - sysInfo.dwNumberOfProcessors * 2 « MAX THREAD NUM ? 


(sysInfo.dwNumberOfProcessors * 2) : MAX THREAD NUM; 
for(int i = 0; i < nThreadCount; i++) { 


HANDLE hThread = CreateThread (NULL, 0, WorkThread, hIOCP, 0, NULL); 


if (hThread 一 NULL) { 
myprintf ("CreateThread: %d\n", GetLastError()); 
__ leave; 

} 

else 
hThreadHandles[i] = hThread; 


g_sockListen = CreateListenSock(); 
if(g sockListen — INVALID SOCKET) 


. leave; 
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84 SOCKET sockAccept; 

85 LPCONN CTX lpConnCtx; 

86 int nResult; 

87 while (true) { 

88 SockAccept = accept(g sockListen, NULL, NULL); 

89 if(sockAccept — INVALID SOCKET) 

90 . leave; 

91 lpConnCtx = CreateConnCtx(sockAccept, hIOCP); 

92 if(lpConnctx == NULL) 

93 . leave; 

94 else 

95 ConnListAdd (lpConnCtx) ; 

96 

97 // 投递 初始 1/0 操作 

98 nResult = WSARecv (sockAccept, 

99 & (lpConnCtx->pPerIOData->wbuf) , 

100 

101 NULL, 

102 & (lpConnCtx->pPerIOData->flags) , 

103 & (lpConnCtx->pPerIOData->OverLapped) , 

104 NULL); 

105 if((nResult == SOCKET ERROR) && (WSAGetLastError() != ERROR IO 

PENDING) ) { 

106 myprintf ("WSARecv: %d\n", WSAGetLastError()); 

107 ConnListRemove (lpConnCtx); 

108 break; 

109 } 

110 } 

111 } 

112 . finallyt 

113 if (hIOCP)( 

114 for(int i = 0; i « nThreadCount; i++) 

115 PostQueuedCompletionStatus (hIOCP, 0, 0, NULL); 

116 } 

117 // 等 待 所 有 工作 线程 结束 

118 if( WAIT OBJECT 0 != WaitForMultipleObjects (nThreadCount, 
hThreadHandles, TRUE, 1000) ) 

119 myprintf("WaitForMultipleObjects failed: %d\n", GetLastError()); 

120 else 


121 for(int i = 0; i < nThreadCount; i++) { 


122 
123 
124 
125 
126 
127 
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136 
137 
138 
139 
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146 


147 
148 
149 


150 
151 
152 
153 
154 
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156 
157 
158 
159 
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if (hThreadHandles[i] != NULL) { 
if(!CloseHandle (hThreadHandles [i])) 
myprintf("CloseHandle: %d\n", GetLastError()); 
$ 
hThreadHandles [i] = NULL; 


if (hIOCP)( 
CloseHandle (hIOCP) ; 
hIOCP = NULL; 


if(g sockListen != INVALID SOCKET)( 
closesocket (g_sockListen) ; 
g_sockListen = INVALID_SOCKET; 

} 

if (g_ptrConnCtxHead) 
ConnListClear (); 


myprintf(".. Stopped. Wn") ; 
DeleteCriticalSection(&g CriticalSection); 
SetConsoleCtrlHandler (CtrlHandler, FALSE); 


WSACleanup(); 


return 0; 


BOOL WINAPI CtrlHandler (DWORD dwEvent) 


{ 


SOCKET sockTemp = INVALID SOCKET; 


switch (dwEvent) { 

case CTRL C EVENT: 

case CTRL LOGOFF EVENT: 
case CTRL SHUTDOWN EVENT: 
case CTRL CLOSE EVENT: 


myprintf ("Server Stopping......\n"); 


SockTemp = g sockListen; 

g sockListen — INVALID SOCKET; 

if(sockTemp != INVALID SOCKET)( 
closesocket (sockTemp) ; 
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160 
161 
162 
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168 
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184 


185 
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187 
188 


189 
190 
191 
192 
193 
194 


sockTemp = INVALID SOCKET; 
) 
break; 
default: 
return FALSE; 


return TRUE; 


// 创建 TVo 完成 端口 
HANDLE CreateNewlIoCompletionPort (DWORD dwNumberOfConcurrentThreads) { 
return (CreateloCompletionPort (INVALID HANDLE VALUE, NULL, 0, 
dwNumberOfConcurrentThreads)); 
} 
// 将 套 接口 与 完成 端口 绑 定 
BOOL AssociateWithIoCompletionPort (HANDLE hComPort, HANDLE hDevice, DWORD 
dwCompKey) { 
return (CreateIoCompletionPort (hDevice, hComPort, dwCompKey, 0) == 
hComPort) ; 
} 
// 创建 服务 器 监听 套 接口 
SOCKET CreateListenSock () 
í 
// fit WSA FLAG OVERLAPPED 属性 的 套 接口 
SOCKET sock = WSASocket(AF INET, SOCK STREAM, 0, NULL, 0, WSA FLAG 
OVERLAPPED) ; 
if(sock — INVALID SOCKET) return sock; 


BOOL bReuseAddr - true; 
if (setsockopt (sock, SOL SOCKET, SO REUSEADDR, (char *) &bReuseAddr, sizeof 
(bReuseAddr) ) == SOCKET_ERROR) { 
myprintf("setsocketopt: %d\n", WSAGetLastError ()); 
closesocket (sock) ; 
return INVALID SOCKET; 


struct sockaddr in local; 

memset (&local, 0, sizeof(local)); 

local.sin addr.s addr = INADDR ANY; 

local.sin family — AF INET; 

local.sin port = htons (9999); 

if(bind(sock, (struct sockaddr *) &local, sizeof (local)) 一 SOCKET ERROR) { 
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214 
215 
216 
217 
218 
219 
220 
221 


222 
223 
224 
225 
226 
227 
228 
229 
230 
231 


232 
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myprintf("bind: %d\n", WSAGetLastError()); 

closesocket (sock) ; 

return INVALID SOCKET; 295) 
} 
if (listen(sock, 5) — SOCKET_ERROR) { 

myprintf("listen: %d\n", WSAGetLastError()); 


closesocket (sock) 7 


return INVALID SOCKET; 


return sock; 


LPCONN CTX CreateConnCtx (SOCKET sockAccept, HANDLE hIOCP) 


{ 


LPCONN CTX lpConnCtx = (LPCONN CTX) GlobalAlloc(GPTR, sizeof (CONN_CTX)); 

if(lpConnctx == NULL) return NULL; 

lpConnctx-»pPerlOData = (LPPER IO DATA) GlobalAlloc(GPTR, sizeof (PER IO 
.DATA)); 

if (lpConnCtx->pPerIOData == NULL) { 


GlobalFree (lpConnCtx); 
lpConnCtx = NULL; 
return NULL; 

} 

// 赋值 

lpConnctx-»pNext = NULL; 

lpConnCtx-»pPrec = NULL; 


lpConnCtx-»sockAccept = sockAccept; 


ZeroMemory (lpConnCtx-»pPerlOData, sizeof (PER IO DATA)); 
lpConnCtx-»pPerlIOData-»OverLapped.hEvent = NULL; 
lpConnCtx-»pPerIOData-»OverLapped.Internal = 0; 
lpConnCtx-»pPerlIOData-»OverLapped.InternalHigh = 0; 
lpConnCtx-»pPerlIOData-»OverLapped.Offset = 0; 
lpConnCtx-»pPerlIOData-»OverLapped.OffsetHigh = 0; 
lpConnCtx-»pPerlIOData-»wbuf.buf = (char *) lpConnCtx-»pPerlOData-»data; 
lpConnctx-»pPerlIOData-»wbuf.len = MAX BUF LEN; 
lpConnctx-»pPerlIOData-»oper = SVR IO READ; 

lpConnctx-»pPerlOData-»flags = 0; 


// 将 套 接口 与 完成 端口 绑 定 
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233 if(!AssociateWithloCompletionPort (hIOCP, (HANDLE) sockAccept, (DWORD) 
IpConnCtx) ) { 

234 myprintf ("AssociateWithIoCompletionPort: %d\n", GetLastError()); 

235 GlobalFree (lpConnCtx->pPerIOData) ; 

236 GlobalFree (lpConnCtx) ; 

234 lpConnCtx = NULL; 

238 return NULL; 

239 } 

240 return lpConnCtx; 

241 ] 


242 void ConnListAdd(LPCONN CTX lpConnCtx) 


243 ( 

244 LPCONN CTX  pTemp; 

245 EnterCriticalSection(&g CriticalSection); 
246 if (g_ptrConnCtxHead == NULL) { 

247 // 链表 的 第 一 个 (惟一 ) 节点 

248 lpConnCtx->pPrec = NULL; 

249 lpConnCtx-»pNext = NULL; 

250 g_ptrConnCtxHead = lpConnCtx; 

251 }else{ 

252 // 加 到 链表 头 部 

253 pTemp = g ptrConnCtxHead; 

254 g_ptrConnCtxHead = lpConnCtx; 

255 lpConnCtx->pNext = pTemp; 

256 lpConnCtx-»pPrec = NULL; 

257 pTemp-»pPrec = lpConnCtx; 

258 } 

259 LeaveCriticalSection (&g_CriticalSection) ; 
260 } 


261 void ConnListRemove (LPCONN CTX lpConnCtx) 


262 { 

263 LPCONN_CTX pPrec; 

264 LPCONN_CTX pNext; 

265 EnterCriticalSection(&g CriticalSection); 
266 if(lpConnctx) { 


267 pPrec = lpConnctx-»pPrec; 
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268 pNext = lpConnCtx-»pNext; 

269 if((pPrec 一 NULL) && (pNext 一 NULL))(// [*] -> NULL: 链表 惟一 节点 

270 g_ptrConnCtxHead = NULL; 

271 : 

272: else if ((pPrec — NULL) && (pNext != NULL)) (// [*] > [] >..-. Ek: 
链表 首 节点 

273 pNext-»pPrec = NULL; 

274 g_ptrConnCtxHead = pNext; 

275 } 

276 else if((pPrec != NULL) && (PNext == NULL))(// [] -> [ ] -> .... [*]: 
链表 末节 点 

277 pPrec-»pNext = NULL; 

278 } 

279 else if( pPrec && pNext ) {// [ ] -> [*] >.... [ ]: 链表 中 间 节点 

280 pPrec->pNext = pNext; 

281 pNext-»pPrec = pPrec; 

282 } 

283 

284 // 关闭 和 连接， 释放 资源 

285 closesocket (lpConnCtx->sockAccept) ; 

286 GlobalFree (lpConnCtx-»pPerIOData); 

287 GlobalFree (lpConnCtx); 

288 lpConnCtx = NULL; 

289 } 

290 

291 LeaveCriticalSection (&g_CriticalSection) ; 

292 return; 

293 } 


294 void ConnListClear() 


295 ( 

296 LPCONN CTX pTempl, pTemp2; 

297 EnterCriticalSection(&g CriticalSection); 
298 pTempl = g ptrConnCtxHead; 

299 while(pTempl) ( 

300 pTemp2 = pTempl-»pNext; 

301 ConnListRemove (pTempl) ; 

302 pTempl = pTemp2; 

303 } 

304 LeaveCriticalSection(&g CriticalSection); 
305 return; 
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307 int myprintf(const char *lpFormat, ...) 


308 { 

309 int nLen = 0; 

310 int nRet = 0; 

3H char cBuffer[512] ; 

312 va list arglist; 

313 HANDLE hOut = NULL; 

314 ZeroMemory (cBuffer, sizeof (cBuffer)); 

315 va start(arglist, lpFormat); 

316 nLen = lstrlen( lpFormat ) ; 

317 nRet = wvsprintf (cBuffer, lpFormat, arglist); 

318 if(nRet >= nLen || GetLastError() == 0) { 

319 hOut = GetStdHandle(STD OUTPUT HANDLE) ; 

320 if(hout != INVALID HANDLE VALUE) 

321 WriteConsole(hOut, cBuffer, lstrlen(cBuffer), (LPDWORD) &nLen, 
NULL); 

322 } 

323 return nLen; 

324 } 


325 DWORD WINAPI WorkThread(LPVOID lpParam) 


326 ( 

327 HANDLE hIOCP = (HANDLE) lpParam; 

328 BOOL bSuccess - false; 

329 DWORD dwIOSize; 

330 LPPER IO DATA lpPerIOData; 

331 LPOVERLAPPED pOverLapped; 

332 LPCONN CTX lpConnCtx; 

333 int nResult; 

334 

335 while(1)( 

336 bSuccess = GetQueuedCompletionStatus (hIOCP, &dwIOSize, (LPDWORD) 
&lpConnCtx, &pOverLapped, INFINITE); 

337 if(!bSuccess) 

338 myprintf ("$dWMn", GetLastError()); 

339 if(lpConnctx == NULL) 


340 return 1; 
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341 lpPerIOData = (LPPER IO DATA) (pOverLapped) ; 

342 if(!bSuccess || (bSuccess && (dwlIOSize == 0))){ 

343 ConnListRemove (lpConnCtx); 299. 

344 continue; 

345 } 

346 #ifdef DEBUG 

347 myprintf ("Different way to obtain PER IO DATA\n"); 

348 myprintf ("The two one must be equal - A:%x\tB:%x\n", 

349 lpConnCtx-»pPerIOData, 

350 lpPerIOData); 

351 #endif 

352 switch (lpPerIOData->oper) { 

353 case SVR IO WRITE:// send then recv 

354 #ifdef DEBUG 

355 myprintf("Socket %d send: %s\n", lpConnCtx-»sockAccept, 

lpPerlOData-»wbuf .buf) ; 

356 #endif 

357 ZeroMemory (lpPerIOData, sizeof (PER IO DATA)); 

358 lpPerlOData-^OverLapped.hEvent = NULL; 

359 lpPerIOData->OverLapped. Internal = 0; 

360 lpPerlOData-»OverLapped.InternalHigh = 0; 

361 lpPerlOData-»OverLapped.Offset = 0; 

362 lpPerlOData-»OverLapped.OffsetHigh = 0; 

363 lpPerlOData-»wbuf.buf = (char *) &(lpPerIOData->data) ; 

364 lpPerlOData-»wbuf.len = MAX BUF LEN; 

365 lpPerlOData-»oper = SVR IO READ; 

366 lpPerIOData->flags = 0; 

367 nResult = WSARecv (lpConnCtx->sockAccept, 

368 &(1pPerlIOData-»wbuf), 

369 l; 

370 NULL, 

371 &(1pPerlIOData-^flags), 

372 & (1lpPerIOData-—>OverLapped) , 

373 NULL); 

374 if (nResult == SOCKET ERROR && WSAGetLastError() != ERROR IO 
PENDING) ( 

315 myprintf("WSARecv: %d\n", WSAGetLastError()); 

376 ConnListRemove (1lpConnCtx) ; 

377 } 

378 break; 

379 case SVR_IO READ:// recv then echo 


380 #ifdef DEBUG 
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381 myprintf ("Socket $d recv: %s\n", lpConnCtx-»sockAccept, 
lpPerIOData->wbuf .buf) ; 


382 #endif 

383 lpPerIOData->wbuf.len = dwIOSize; 

384 lpPerlOData-»oper = SVR IO WRITE; 

385 lpPerlOData-»flags = 0; 

386 nResult = WSASend (lpConnCtx-»sockAccept, 

387 & (1pPerIOData-»wbuf), 

388 1, 

389 NULL, 

390 lpPerIOData->flags, 

391 & (1IpPerIOData-»OverLapped), 

392 NULL); 

393 if(nResult — SOCKET ERROR && WSAGetLastError() != ERROR IO 
PENDING) ( 

394 myprintf("WSASend: %d\n", WSAGetLastError()); 

395 ConnListRemove (lpConnCtx); 

396 ) 

397 break; 

398 default:; 

399 } 

400 } 

401 return 0; 

402 } 
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程序 21.3 给 出 了 基于 IOCP 的 ECHO 服务 器 代码 ， 该 程序 完成 的 功能 与 程序 21.2、21.1 
完全 相同 。 下 面 对 它 进行 详细 的 分 析 介绍 。 

l. 数据 结构 和 全 局 变量 

O IO OPER 数据 结构 


typedef enum IO OPER{ 
SVR_IO_READ, 
SVR_IO_WRITE 

)IO OPER, *LPIO OPER; 


枚 举 类 型 ， 用 于 指示 服务 器 VO 操作 的 类 型 。 
C) PER IO DATA 数据 结构 


typedef struct  OverLappedEx( 
OVERLAPPED OverLapped; 
WSABUF wbuf; 
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Char data[MAX BUF LEN]; 
IO OPER oper; 
DWORD flags; 


) PER IO DATA, *LPPER IO DATA; 


该 结构 体 是 扩展 重叠 结构 ， 单 /O 数据 。 其 中 wbuf 是 VO 操作 的 数据 对 象 ，data 是 实际 
的 数据 缓冲 区 ; oper 用 于 标志 VO 操作 的 类 型 ，IO_OPER 枚 举 型 ， 可 以 是 SVR IO READ 
或 者 是 SVR_IO_WRITE; flags 用 于 设 定 或 者 返回 IO 操作 的 标志 。 

C) CONN CTX 数据 结构 


typedef struct CONN CTx{ 


SOCKET sockAccept; 
LPPER_IO_DATA pPerIOData; 
struct _CONN_CTX *pPrec; 
struct _CONN_CTX *pNext; 


} CONN_CTX, *LPCONN_CTX; 


单 句柄 数据 结构 ,用 于 保存 每 个 客户 端的 连接 信息 。 其 中 sockAccept 是 该 连接 的 服务 器 
端 服务 套 接口 ; pPerIOData 指向 该 连接 的 VO 操作 信息 ; pPrex 和 pNext 用 于 形成 服务 器 当前 
所 有 连接 信息 的 双向 链表 ， 分 别 指向 链表 中 的 前 一 个 节点 和 后 一 个 节点 。 

O g CriticalSection 全 局 变量 

用 于 主线 程 和 各 个 服务 线程 之 间 的 同步 ， 主 要 目的 是 防止 对 连接 信息 链表 的 访问 冲突 。 

O g ptrConnCtxHead 全 局 变量 

指向 连接 信息 双向 链表 的 首 节 点 (最 新 加 入 的 客户 端 连接 ) ， 用 于 对 该 链表 的 访问 和 维护 。 

2. 函数 

O BOOL WINAPI CtrlHandlerrDWORD dwEvent) 

该 函数 对 控制 台 消息 进行 处 理 ， 当 接收 到 CTRL C EVENT. CTRL LOGOFF EVENT, 
CTRL SHUTDOWN EVENT 或 者 CTRL_ CLOSE EVENT 事件 时 ， 服 务 器 将 关闭 监听 套 接 
口 ， 从 而 导致 主线 程 从 接收 连接 的 死 循环 中 退出 ， 并 最 终结 束 所 有 服务 线程 、 释 放 连 接 并 
停机 。 

O LPCONN CTX CreateConnCtx(SOCKET sockAccept, HANDLE hIOCP) 

当 服 务 器 接受 了 客户 端 连接 请 求 后 ， 将 返回 的 服务 套 接口 和 完成 端口 作为 参数 调用 该 函 
数 。 该 函数 完成 服务 套 接 口 与 完成 端口 的 绑 定 , 以 及 为 该 连接 的 相关 信息 分 配 存储 区 的 工作 。 

O void ConnListAdd(LPCONN CTX IpConnCtx) 

本 函数 将 新 的 连接 信息 加 入 到 全 局 的 连接 信息 链表 。 

O void ConnListRemove(LPCONN CTX IpConnCtx) 

本 函数 将 指定 的 连接 信息 从 全 局 连接 信息 链表 中 删 去 ， 并 关闭 连接 、 释 放 相 应 的 存储 区 
资源 。 

O void ConnListClear() 

本 函数 完成 服务 器 退出 时 关闭 连接 、 释 放 资 源 的 工作 。 对 全 局 连接 信息 链表 中 的 每 个 节 
点 ， 逐 个 调用 ConnListRemove 函数 。 

O int myprintf(const char *IpFormat, ...) 
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由 于 printf 函数 只 能 在 用 C 运行 库 中 函数 创建 的 线程 中 使 用 ， 本 程序 重 写 了 自己 的 输出 

函数 。 
3. 流程 
整个 服务 器 的 流程 与 图 21.4 介绍 的 基本 一 致 , 惟一 的 差别 在 于 服务 器 的 退出 处 理 。 当 服 
务 器 控制 台 接收 到 特定 的 退出 消息 后 ， 消 息 处 理 函数 将 监听 套 接口 关闭 ， 从 而 导致 主线 程 退 
出 服务 循环 ， 随 后 ， 主 线程 调用 PostQueuedCompletionStatus 函数 向 所 有 的 服务 线程 发 送 完 
成 键 为 NULL 的 完成 信息 ， 通 知 各 服务 线程 退出 服务 ; 在 所 有 服务 线程 均 结束 后 ， 主 线程 对 
全 局 连接 信息 链表 中 的 连接 逐个 关闭 并 释放 所 用 资源 ; 在 资源 释放 完毕 后 , 主线 程 结束 运 
行 。 

4. 代码 分 析 

第 5 一 6 行 定义 了 两 个 常量 MAX. THREAD NUM fll MAX. BUF LEN, 分 别 用 于 表示 最 
大 的 服务 线程 数目 和 服务 器 IO 缓冲 区 的 大 小 。 

第 7 一 25 行 定义 了 所 需 使 用 的 3 个 数据 结构 。 

第 26—28 行 定 义 了 3 个 全 局 变量 g_CriticalSection、g_ptrConnCtxHead 和 g_sockListen. 

第 29 一 42 行 声明 了 若干 函数 。 

第 43 一 146 行 main 函数 。 

C) 48 一 52 行 ， 初 始 化 winsock。 

O 55—58 行 ， 调 用 SetConsoleCtrlHandler 函数 设置 控制 台 事件 的 响应 函数 。 

O 59 行 ， 初 始 化 临界 区 变量 g_CriticalSection 。 

O 60~111 行 ，_try 程序 段 。 这 部 分 代码 使 用 了 C++ 的 try-finally 程序 结构 。 如 果 在 
try 程序 段 代 码 执行 过 程 中 出 现 了 异常 或 者 调用 了 _leave 语句 ， 那 么 程序 将 跳 转 
至 _ finally 程序 段 执行 。 

+ 61~66 行 ， 创 建 VO 完成 端口 HOCP。 

68~80 行将 sysInfo.dwNumberOfProcessors*2 和 MAX THREAD NUM 之 间 的 较 
小 值 赋 给 nThreadCount; 然后 创建 nThreadCount 个 工作 线程 , 并 将 线程 句柄 保存 在 
hThreadHandles 数组 中 。 

+ 81~83 行 ， 调 用 CreateListensock 函数 创建 监听 套 接口 g_sockListen 。 

+ 87~110 行 ， 循 环 体 。 服 务 器 循环 接受 外 来 连接 请 求 ， 创 建 连接 信息 IpConnCtx 并 

保存 至 全 局 连接 信息 链表 ， 最 后 投递 初始 WSARecv 操作 请 求 。 

O 112~139 行 ，_finally 程序 段 ， 进 行 资源 释放 等 程序 结束 的 清理 工作 。 

* 113—116 行 ， 如 果 完 成 端口 句柄 hIOCP 不 为 NULL， 投 递 nThreadCount 个 完成 键 
为 NULL 的 完成 信息 包 ， 通 知 工作 线程 终止 服务 。 

117~127 行 ， 等 待 工作 线程 结束 ， 并 关闭 其 句柄 。 

128 一 131 行 ， 关 闭 完成 端口 。 

133 一 136 行 ， 关 闭 监 听 套 接口 。 

137~138 行 ， 调 用 ConnListClear 函数 清除 连接 信息 链表 。 

142—145 行 ， 删 除 临 界 区 变量 g_CriticalSection， 取 消 控制 台 事件 响应 函数 的 设 定 ， 
并 结束 winsock 的 使 用 。 
147—168 行 CtrlHandler 函数 定义 。 当 控制 台 收 到 CTRL C EVENT. CTRL_ 


+ 
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LOGOFF EVENT. CTRL SHUTDOWN EVENT 或 者 CTRL CLOSE EVENT 事件 时 ， 关 闭 
套 接口 g_sockListen。 该 操作 将 导致 main 函数 中 accept 操作 失败 ， 从 而 跳 转 至 ”finally 程 
序 段 。 
第 169 一 176 行 CreateNewIoCompletionPort 和 AssociateWithIoCompletionPort 函数 定义 。 
第 177 一 206 行 CreateListenSock 函数 ， 创 建 服务 器 监听 套 接口 。 首 先 创建 WSA FLAG 
_OVERLAPPED 属性 的 套 接口 ， 然 后 在 该 套 接口 上 启用 SO_REUSEADDR 选项 ， 最 后 绑 定 
本 地 9999 端口 并 调用 listen 函数 使 之 处 于 监听 状态 。 
第 207—241 行 CreateConnCtx 函数 。 为 sockAccept 对 应 的 已 接受 的 客户 端 连 接 创建 连 
接 信息 数据 ， 并 将 sockAccept 与 完成 端口 绑 定 。 
第 242 一 260 行 ConnListAdd 函数 ,将 连接 信息 lpConnCtx 加 入 到 全 局 的 连接 信息 链表 中 ， 
线程 之 间 对 该 链表 的 互 斥 访问 使 用 临界 区 变量 g_CriticalSection 来 实现 。 
第 261 一 293 行 ConnListRemove 函数 ， 将 连接 信息 IpConnCtx 从 全 局 的 连接 信息 链表 中 
删除 ， 关 闭 相应 的 套 接 口 并 释放 资源 。 
第 294 一 306 行 ConnListClear 函数 ， 调 用 ConnListRemove 函数 清除 连接 信息 链表 。 
第 307 一 324 行 myprintf 函数 ， 自 定义 的 控制 台 输 出 函数 ， 惟 一 需要 注意 的 是 该 函数 接 
收 不 定 长 输入 变量 。 
第 325 一 402 行 WorkThread 线程 函数 。335 一 400 行 是 函数 主 服务 循环 。 
O 336—351 行 ， 调 用 GetQueuedCompletionStatus 函数 获取 完成 信息 。 如 果 得 到 的 完 
成 键 为 空 ， 则 终止 该 工作 线程 ， 如果 GetQueuedCompletionStatus 返回 FALSE 或 
者 VO 数据 量 为 0〈 说 明 客户 端 断 开 了 连接 )， 则 调用 ConnListRemove 函数 清除 该 
连接 。 
O 352—399 行 ， 根 据 完 成 信息 中 的 lpPerIOData->oper 数据 ， 判 断 该 完成 信息 所 对 应 
的 服务 器 VO 操作 类 型 : 如 果 是 SVR_IO_WRITE, 那么 投递 下 一 次 WSARecv 请 求 ; 
如 果 是 SVR_IO_READ， 说 明 已 读 取 了 客户 端 发 送 的 数据 ， 那 么 投递 WSASend 操 
作 请 求 ， 对 客户 端 进行 Echo。 


21.3 ” 几 种 服务 器 架构 的 分 析 与 比较 


至 此 ， 已 经 介绍 完 常见 的 TCP 服务 器 架构 (如 图 21.5 所 示 ) ， 本 节 对 这 些 架 构 的 优 缺 
点 进行 简单 的 分 析 。 

首先 是 欠 代 服务 器 和 并 发 服务 器 ， 这 两 者 之 间 的 区 别 是 非常 明显 的 。 由 于 迭代 服务 器 每 
次 只 能 接收 一 个 连接 请 求 为 一 个 客户 端 服务 ， 因 此 这 种 服务 器 只 适用 于 一 些 非常 简单 的 服务 
类 型 。 通 常 所 看 到 的 TCP 服务 器 都 是 采用 并 发 工作 方式 , 而 迭代 方式 一 般 用 于 UDP 服务 器 。 

其 次 是 并 发 服务 器 的 3 种 架构 ， 这 3 种 架构 在 实际 环境 中 都 能 够 看 到 ， 虽 然 公认 完成 端 
口 模型 是 Win32 平台 下 的 扩展 性 最 好 的 服务 器 模型 ， 但 是 并 不 是 所 有 情况 下 都 使 用 该 模型 。 
这 是 因为 一 方面 完成 端口 模型 相对 而 言 较为 复杂 ; 另 一 方面 在 服务 器 负载 不 大 的 情况 下 ， 另 
两 种 模型 反而 能 获得 更 好 的 服务 性 能 。 针 对 这 3 种 服务 器 架构 的 选择 问题 ， 给 出 如 下 结论 : 

口 ” 当 服务 器 负载 要 求 较 轻 时 ， 普 通 的 每 客户 单线 程 模 型 就 足够 了 。 服 务 器 启动 一 个 监 
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听 线 程 ， 然 后 为 每 一 个 到 来 的 连接 请 求 派生 一 个 工作 线程 。 这 些 工 作 线程 都 是 在 需 
要 提供 服务 时 创建 ， 服 务 完毕 时 消亡 。 


TERRE SE 


TCP 服务 器 每 客户 单线 程 
并 发 服务 器 线程 池 


完成 端口 
图 21.5 常见 TCP 服务 器 系统 架构 


口 ” 相 对 于 为 每 个 到 来 的 客户 创建 工作 线程 的 方式 ， 预 先 创建 一 个 线程 池 可 以 大 大 减少 
系统 的 耗费 。 但 是 ， 对 于 实用 的 系统 来 说 ， 必 须要 有 一 个 启发 式 算法 合理 地 调整 线 
程 池 中 的 线程 数目 ， 这 个 算法 必须 综合 考虑 当前 运行 线程 数 、 空 闲 线程 数 以 及 系统 
负荷 等 多 方面 的 因素 。 

DO ”如 果 服 务 器 的 性 能 要 求 很 高 ， 需 要 同时 为 成 千 上 万 的 并 发 客户 服务 ， 并 且 希 望 系统 
能 充分 利用 多 个 处 理 器 的 优势 ， 那 么 完成 端口 是 必然 的 选择 。 它 不 仅 具有 线程 池 模 
型 的 优点 ， 而 且 能 更 充分 、 高 效 地 利用 每 个 工作 线程 。 同 样 ， 动 态 调整 服务 器 系统 
中 的 线程 数 的 智能 算法 也 是 必需 的 。 
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在 前 几 章 用 了 很 大 的 篇 幅 介绍 如 何 使 用 套 接口 APT 进行 网 络 编程 ， 以 及 一 些 常见 的 C/S 
服务 器 模型 设计 和 相应 的 编程 方法 ， 本 章 将 用 一 个 完整 的 Web 服务 器 的 例子 一 一 MyWeb 项 
目 来 对 这 些 内 容 进行 演示 。 

MyWeb 项 目 应 用 Winsock 接口 函数 实现 基本 的 WWW 服务 器 功能 ， 整 个 系统 基于 VO 
完成 端口 模型 ， 多 线程 、 多 用 户 ， 可 以 作为 大 型 软件 系统 中 的 WEB 页 面 发 布 模块 使 用 ， 也 
可 以 扩展 为 一 个 独立 的 Win32 平台 下 的 高 性 能 Web 服务 器 。 

MyWeb 目前 仅 支持 HTTP-GET 指令 和 以 HTM/HTML 为 文件 后 级 名 的 标准 网 页 。 部 分 
代码 参考 了 Souren Abeghyan 发 布 在 www.codeproject.com 的 “Multithreaded server class with 
example of HTTP server” 一 文 ， 在 此 表示 感谢 。 


22.1 MyWeb 服务 器 的 使 用 


在 给 出 MyWeb 的 设计 与 实现 的 详细 分 析 之 前 ， 首 先 简单 地 介绍 该 系统 的 用 户 界面 以 及 
操作 流程 。 
22.1.1 用 户 界面 


MyWeb 的 用 户 界面 可 以 分 为 两 部 分 : 主 对 话 框 (图 22.1) 和 任务 栏 图 标 (图 22.2) 。 
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图 22.1 MyWeb 服务 器 的 操作 界面 
在 主 对 话 框 中 ， 提 供 了 3 个 菜单 项 ， 分 别 是 “服务 器 ”、“ 选 项 ”和 “帮助 ”。 其 中 “ 服 
务 器 ”菜单 包含 了 服务 器 的 4 个 基本 操作 : “启动 ”、“ 和 暂停 ”、“ 人 停止” 和 “退出 ”: “ 选 
项 ”菜单 包含 两 项 功能 : “配置 ”服务 器 与 “复位 ”选项 数据 ， 用 户 可 配置 的 选项 数据 有 
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MyWeb 的 服务 端口 (默认 为 80) 、 默 认 页 面 (index.htm) 以 及 服务 器 的 工作 目录 ; “帮助 ” 
菜单 中 的 “关于 ”给 出 了 MyWeb 服务 器 的 一 些 基本 信息 。 

MyWeb 提供 的 另 一 个 操作 界面 是 任务 栏 图 标 。 该 图 标 主要 起 两 方面 的 作用 : © BRE 
对 话 框 提 供 基本 的 服务 器 操作 界面 ; @ 通过 不 同 图 标的 切换 ， 显 示 服 务 器 的 当前 状态 。 如 
图 22.2 所 示 。 

当 用 户 右键 单 击 该 图 标 时 ， 会 弹出 一 个 快捷 菜单 ， 如 图 22.3 所 示 。 该 菜单 基本 上 涵盖 了 
主 对 话 框 中 提供 的 所 有 操作 功能 。 
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图 22.2 MyWeb 的 任务 栏 图 标 图 22.3 MyWeb 弹出 菜单 


22.1.2 ”操作 流程 


MyWeb 的 操作 非常 简单 ， 主 要 分 为 两 部 分 : 配置 系统 和 启动 /暂停 /停止 服务 。 

OD 配置 系统 

在 默认 情况 下 ，MyWeb 服务 器 在 80 端口 启动 WWW 服务 ， 工 作 目录 为 C\MyWeb， 默 
认 主 页 是 index.htm。 如 果 这 些 选项 不 符合 用 户 的 实际 情况 ， 那 么 可 以 在 启动 MyWeb 服务 器 
之 前 进行 系统 配置 。 单 击 主 对 话 框 中 的 菜单 “选项 ”一 “配置 ”命令 ， 或 者 单 击 任务 栏 图 标 
的 弹出 菜单 中 的 “配置 服务 器 ”命令 ， 系 统 都 将 弹出 “服务 器 配置 对 话 框 ”， 如 图 22.4 所 示 。 
在 该 对 话 框 中 ， 用 户 可 以 设置 服务 器 的 基本 选项 。 

如 果 单 击 了 主 菜单 中 的 “选项 ”一 “复位 ”命令 ， 在 得 到 确认 后 用 户 的 所 有 配置 信息 都 
将 丢失 ， 系 统 将 使 用 默认 配置 。 
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(2) 启动 /暂停 /停止 服务 

“服务 器 ”菜单 的 前 三 项 分 别 用 于 服务 器 的 启动 、 暂 停 和 停止 ， 相 对 应 ， 弹 出 菜单 中 有 
“启动 Myweb", "f Myweb" Fil ^ iE Myweb" 3 个 菜单 项 。 当 单 击 “启动 ”后 , MyWeb 
将 读 取 系 统 的 配置 数据 并 启动 WWW 服务 。 如 果 启 动 成 功 , 那么 在 主 对 话 框 的 系统 信息 输出 
框 中 将 给 出 启动 信息 ， 如 图 22.1 中 间 部 分 所 示 。 此 外 ， 服 务 器 的 其 他 操作 如 暂停 、 停 止 ， 以 
及 客户 端的 访问 情况 也 会 在 这 里 被 输出 。 
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此 时 ,打开 浏览 器 在 地 址 栏 输入 MyWeb 所 在 主机 的 IP 或 者 域名 ， 即 可 访问 到 相应 的 主 
页 ， 如 图 22.5 所 示 。 
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22.5 浏览 页 面 


将 服务 器 暂停 的 作用 是 , 暂时 拒绝 所 有 外 来 的 新 的 连接 请 求 , 但 是 并 不 关闭 已 有 的 连接 ， 
因此 也 不 会 释放 服务 器 用 于 保存 连接 信息 的 系统 资源 。 如 果 希 望 将 服务 器 彻底 重启 ， 那 么 可 
以 选择 停止 服务 器 ， 然 后 再 启动 。 


222 源码 及 其 分 析 


整个 项 目 采用 微软 的 MFC 架构 ， 属 于 基于 对 话 框 的 应 用 程序 。 全 部 代码 除了 VC 自动 
生成 的 CMyWebServerDls、CMyWebServerApp 和 CaboutDlg 3 个 基本 类 之 外 ， 还 包含 了 
COptions, COptionsDlg, CMyNotifyIcon, ChttpServer 4 个 类 ， 以 及 CONN_CTX、PER IO_ 
DATA 两 个 重要 数据 结构 。 下面 按 照 先 外 围 后 核心 、 先 简单 后 复杂 的 顺序 对 这 些 类 加 以 分 析 。 

在 介绍 此 部 分 内 容 时 ， 假 设 读者 已 经 掌握 基本 的 Winsock API 和 多 线程 编程 ， 对 C++ 的 
标准 模板 库 STL 和 VC 的 MFC 框架 的 使 用 也 有 一 定 的 了 解 ， 能 够 独立 开发 简单 的 基于 对 话 
HERS MFC 应 用 程序 。 


22.2.1 COptions 类 
COptions 类 用 于 读 取 /保存 服务 器 的 配置 参数 , 所 有 操作 均 围 绕 注册 表 进 行 。 下 面 首先 分 
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析 COptions 类 的 接口 声明 ， 源 码 如 下 : 


MAAN 
// options.h: COptions 类 的 接口 说 明 . Create: 2004-03-24 Last Modify: 2004-03-24 
HMM MB g M MH M M M M M M M P P P PM M HH P P M M P P P abb HH MH g g 
1 dif !defined(AFX OPTIONS H 5A89F18B E7Dl 41BE B74A EB3A35D65104 INCLUDED ) 
2 #define AFX OPTIONS H 5A89F18B E7Dl 41BE B74A EB3A35D65104 INCLUDED 


#if MSC VER > 1000 
4 #pragma once 
#endif // _MSC VER > 1000 


6 class COptions 

| 

8 public: 

9 COptions () 7 

10 virtual ~COptions(); 
11 public: 

12 void LoadDefOptions(); 
13 char m szDefaultPage [255]; 
14 char m szHomeDir[255]; 
15 UINT m nServerPort; 

16 protected: 

17 void SaveOptions(); 

18 void GetOptions(); 

19 y 


20 extern COptions *g pSvrOptions; 


21 #endif 
HMM M M M HL P P P P P P P PH HH HM M I I I LH P P n vnlg 


第 12 行 声明 了 COptions 类 的 public 成 员 函 数 LoadDefOptions， 用 户 可 调用 该 函数 复位 
服务 器 选项 参数 。 

第 13 一 15 行 声 明了 3 个 public 成 员 变 量 m szDefaultPage m szHomeDir 和 
m_nServerPort， 分 别 对 应 MyWeb 服务 器 的 默认 主页 、 用 户 目录 和 服务 端口 。 用 户 使 用 时 ， 
可 以 直接 对 这 几 个 变量 进行 修改 、 赋 值 。 

第 17 行 SaveOptions 成 员 函 数 ，protected 类 型 ， 用 于 将 选项 参数 保存 到 注册 表 中 。 

第 18 行 GetOptions MAMA, protected 类 型 ， 用 于 从 注册 表 读 取 选 项 参数 。 

第 20 行 g_pSvrOptions， 全 局 变量 ， 指 向 COptions 类 的 指针 ， 该 变量 由 extern 描述 符 修 
饰 ， 外 部 连接 ， 在 Options.cpp 文件 中 定义 实现 。 

下 面 是 COptions 类 实现 的 源码 : 


HMM P B MM I LL Mg gM HL M MM P P M P PP MM P M HP M P 4 H B MM P MM 
// Options.cpp: COptions 类 的 实现 ， 完 成 了 基于 注册 表 的 配置 信息 读 / 写 功能 
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// Create: 2004-03-24 Last Modify: 2004-03-25 
MAA 


onone 


#include "stdafx.h" 
#include "MyWebServer.h" 
#include "Options.h" 


#ifdef _DEBUG 
#undef THIS FILE 

static char THIS FILE[]- FILE ; 
#define new DEBUG NEW 

#endif 


COptions SvrOptions; 
COptions *g pSvrOptions = & SvrOptions; 


HIM M M M M I I HH HM I I M TTT I HL M M I P P P nng 
// Construction/Destruction 
HIM B MIHI M HM M P M P P P P P MM TATA AAA TATA | n n g g ng 


COptions::COptions() 


GetOptions (); 


COptions: :~COptions () 


SaveOptions () ; 


void COptions: :GetOptions () 


LoadDefOptions () ; 

HKEYhKey; 

DWORD dwType, dwcbData; 

RegCreateKey (HKEY_CURRENT_USER, 

"SOFTWARE \\CSE528 .SEU\\MyWebServer\\Options", &hKey); 

dwcbData = 255; 

RegQueryValueEx(hKey, "HomeDir", NULL, &dwType, (LPBYTE) m szHomeDir, 
&dwcbData) ; 

dwcbData = 255; 

RegQueryValueEx (hKey, "DefaultPage", NULL, &dwType, (LPBYTE)m szDefaultPage, 
&dwcbData) ; 

dwcbData = 255; 

RegQueryValueEx (hKey, "ServerPort", NULL, &dwType, (LPBYTE) &m nServerPort, 
&dwcbData) ; 

RegCloseKey (hKey) ; 
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void COptions: :SaveOptions () 
t 
HKEYhKey; 
RegOpenKeyEx (HKEY CURRENT USER, 
"SOFTWARE \ \CSE528 . SEU\\MyWebServer\\Options", 0, KEY ALL ACCESS, &hKey); 
RegSetValueEx (hKey, "HomeDir", NULL, REG SZ, (CONST BYTE *) m szHomeDir, 
strlen(m szHomeDir)); 
RegSetValueEx(hKey, "DefaultPage", NULL, REG SZ, (CONST BYTE *) m 
szDefaultPage, 
strlen (m szDefaultPage)); 
RegSetValueEx (hKey, "ServerPort", NULL, REG DWORD, 
(CONST BYTE *)&m nServerPort, sizeof (m nServerPort)); 
RegCloseKey (hKey) ; 
I 


void COptions::LoadDefOptions () 

f 
strncpy(m szHomeDir, "C:\\MyWeb", 255); 
strncpy(m szDefaultPage, "index.htm", 255); 
m nServerPort - 80; 


) 


HH BM HH M M HH HH M HM HM HH M TTA TATA P P P 9 


第 9 一 10 行 定 义 了 一 个 COptions 类 的 实例 _SvrOptions， 以 及 指向 该 变量 的 指针 
g_pSvrOptions. 

第 14—17 fT COptions 类 的 构造 函数 ， 该 函数 调用 类 的 protected 成 员 函 数 GetOptions, 
从 注册 表 中 读 取 数据 。 

第 18~21 行 COptions 类 的 析 构 函数 ， 该 函数 调用 类 的 protected 成 员 函 数 SaveOptions, 
将 数据 保存 至 注册 表 。 

第 22 一 39 行 GetOptions 成 员 函 数 , 从 注册 表 中 读 取 服 务 器 选项 数据 , 并 赋 给 3 public 
成 员 变 量 m szDefaultPage, m szHomeDir fll m_nServerPort。 


口 


口 


口 


在 第 24 行 ， 调 用 LoadDefOptions 函数 ， 给 3 个 成 员 变 量 m_szDefaultPage、 

m szHomeDir 和 m_nServerPort 赋 默 认 值 。 

25~28 行 ， 调 用 RegOpenKeyEx 函数 读 取 或 者 创建 注册 表 项 HKEY_CURRENT 
_USER\\SOFTWARE\\CSE528.SEU\\MyWebServer\\Options. 

29—37 行 ， 调 用 RegQueryValueEx 函数 读 取 注 册 表 项 HKEY CURRENT USER 
\\SOFTWARE\\CSE528.SEU\\MyWebServer\\Options 的 3 ^^ f Ji HomeDir 、 

DefaultPage 和 ServerPort。 如 果 某 个 子 项 不 存在 ， 则 RegQueryValueEx 函数 会 创建 
该 子 项 并 将 相应 的 成 员 变量 的 当前 值 〈 即 默认 值 ， 见 24 行 ) 写 入 注册 表 。 

38 行 ， 关 闭 注册 表 。 


58 40—52 fT SaveOptions 成 员 函 数 。 调 用 RegSetValueEx 函数 将 注册 表 m_szDefaultPage、 
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m szHomeDir 和 m_nServerPort 的 值 保存 至 注册 表 对 应 表 项 。 

第 53—58 行 给 3 个 成 员 变量 m szDefaultPage, m szHomeDir 和 m nServerPort MEK 
认 值 。 

我 们 在 Options.cpp 文件 中 的 第 9 一 10 行 定义 了 COptions 类 的 实例 _SvrOptions， 并 且 将 
g pSvrOptions 赋值 为 该 实例 的 地 址 。 其 中 的 _SvrOptions 仅 在 COptions 模块 中 可 见 ， 而 
g_pSvrOptions 为 全 局 变量 ， 可 由 其 他 模块 通过 包含 Options.h 文件 来 使 用 。 这 样 设计 的 意义 
在 于 ， 当 COptions 模块 被 包含 在 某 个 项 目 中 时 ， 由 于 _SvrOptions 的 存在 ， 系 统 会 立即 调用 
COptions 类 的 构造 函数 , 从 而 自动 读 取 注 册 表 中 的 相关 数据 ; 而 用 户 可 以 通过 g_pSvrOptions 
指针 来 读 取 或 者 修改 _SvrOptions 的 成 员 变 量 值 ， 当 软件 运行 结束 系统 释放 资源 时 ， 
_SvrOptions 的 析 构 函数 又 会 被 自动 执行 ， 从 而 将 当前 的 m_szDefaultPage, m szHomeDir 和 
m nServerPort 值 保存 至 注册 表 。 


22.2.2 COptSetupDlg 类 


COptSetupDlg 类 由 系统 为 服务 器 配置 对 话 框 IDD_DIALOG OPTSETUP 自动 生成 , 主要 
向 用 户 提供 参数 设置 的 用 户 界 面 ， 并 将 这 些 数据 赋值 给 全 局 的 COptions 类 实例 变量 。 
对 应 于 图 22.6 中 的 输入 控件 ， 为 该 类 添加 了 3 个 成 员 变 量 : 


CString m strDefaultPage; 对 应 于 缺 省 页 面 : IDC COMBO DEFPAGE 
CString m strHomeDir; 对 应 于 用 户 目 录 : IDC EDIT HOMEDIR 
UINT m nSvrPort; 对 应 于 服务 端口 : IDC_EDIT_PORT 


Wan: [eom mame: [ a 
BPBR:[ ——— eem s 
一 一 一 一 


取消 
图 22.6 服务 器 配置 对 话 框 设 计 
下 面 是 COptSetupDlg 类 的 头 文件 : 


AMA 

// OptSetupDlg.h : 配置 数据 操作 对 话 框 类 的 头 文件 

// Create: 2004-03-25 LastModify: 2004-03-25 

HMM HH HH M I P P P P LP n n LH n PP CMM 

1 dif !defined(AFX OPTSETUPDLG H 0248A960 2C27 49BD 8B26 6D9E00727684 INCL 
UDED ) 

2  #define AFX OPTSETUPDLG H 0248A960 2C27 49BD 8B26 6D9E00727684 INCLUDED 


3 #if MSC VER > 1000 
4 #pragma once 
5 #endif // MSC_VER > 1000 


class COptSetupDlg : public CDialog 
了 { 
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8  // Construction 
9 public: 
10 COptSetupDlg(CWnd* pParent = NULL);  // standard constructor 


11 // Dialog Data 


12 //((AFX DATA (COptSetupDlg) 

13 enum ( IDD = IDD DIALOG OPTSETUP }; 
14 CString m strDefaultPage; 

15 CString m strHomeDir; 

16 UINT m nSvrPort; 

17 //) JAFX DATA 


18 // Overrides 


19 // ClassWizard generated virtual function overrides 

20 //((AFX VIRTUAL (COptSetupDlg) 

21 protected: 

22 virtual void DoDataExchange(CDataExchange* pDX); // DDX/DDV support 
23 //) )AFX VIRTUAL 


24 // Implementation 
25 protected: 


26 // Generated message map functions 
27 //{{AFX MSG (COptSetupDlg) 

28 virtual void OnOK(); 

29 afx msg void OnButtonSelHomepage () ; 
30 //) )AFX MSG 

31 DECLARE MESSAGE MAP() 

32 yp; 


33  //((AFX INSERT LOCATION} } 
34 // Microsoft Visual C++ will insert additional declarations immediately before 
the previous line. 


35 #endif 
HMM M I M P P P P P P P P P P P LH LL I P P n V! n wd ng nga 


上 面 代码 中 的 黑体 部 分 值得 读者 注意 ， 它 们 声明 了 3 个 成 员 变 量 和 两 个 成 员 函 数 。 总 的 
来 说 ，COptSetupDlg 类 还 是 非常 简单 的 ， 下 面 直接 给 出 其 实现 代码 : 


MAMA 
// OptSetupDlg.cpp: 配置 数据 操作 对 话 框 的 实现 ， 操 作 Coptions 类 的 一 个 实例 

// Create: 2004-03-25 LastModify: 2004-03-25 

HU ll PHP PHP P P P P P PL P PP P P P P P P TTA TATA TATA M P MUN Gg 
1 #include "stdafx.h" 

2 #include "MyWebServer.h" 

3 #include "OptSetupDlg.h" 

4 #include "Options.h" 


v 0-00 
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#ifdef _DEBUG 
#define new DEBUG NEW 

#undef THIS FILE 

static char THIS FILE[] = _ FILE ; 
#endif 


HB g M P P P MM HL P P P Mg HH P M P P P P Pg M HH P P Pg gH  g gag 
// COptSetupDlg dialog 


COptSetupDlg::COptSetupDlg (CWnd* pParent /*-NULL*/) 
: CDialog(COptSetupDlg::IDD, pParent) 
{ 
//((AFX DATA INIT (COptSetupDlg) 
m strDefaultPage = T(g pSvrOptions-»m szDefaultPage); 
m strHomeDir = _T(g_pSvrOptions->m_szHomeDir) ; 
m nSvrPort = g pSvrOptions-»m nServerPort; 
//))AFX DATA INIT 


void COptSetupDlg: : DoDataExchange (CDataExchange* pDX) 
{ 
CDialog: : DoDataExchange (pDX) ; 
//((AFX DATA MAP (COptSetupDlg) 
DDX CBString(pDX, IDC COMBO DEFPAGE, m strDefaultPage); 
DDX Text(pDX, IDC EDIT HOMEDIR, m strHomeDir); 
DDX Text(pDX, IDC EDIT PORT, m nSvrPort); 
//))AFX DATA MAP 
} 


BEGIN MESSAGE MAP(COptSetupDlg, CDialog) 
//((AFX MSG MAP (COptSetupDlg) 
ON BN CLICKED(IDC BUTTON SEL HOMEDIR, OnButtonSelHomepage) 
//) )&FX MSG MAP 

END MESSAGE MAP () 


Hl LT M P B TATA TATA TAA AAA AAA M HTML GGg 
// COptSetupDlg message handlers 


void COptSetupDlg: :OnOK () 

f 
// TODO: Add extra validation here 
UpdateData () ; 
strncpy(g pSvrOptions-»m szHomeDir, m strHomeDir, 255); 
strncpy(g pSvrOptions-»m szDefaultPage, m strDefaultPage, 255); 
g pSvrOptions-»m nServerPort = m nSvrPort; 


CDialog::OnOK(); 
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47 void COptSetupDlg: :OnButtonSelHomepage () 


48 { 

49 // TODO: Add your control notification handler code here 
50 BROWSEINFO bi; 

51 char szFolderName[MAX PATH]; 

52 char szDirName[MAX PATH]; 

53 LPMALLOC lpMalloc; 

54 bi.hwndOwner = GetSafeHwnd(); 

55 bi.pidlRoot = NULL; 

56 bi.pszDisplayName = szFolderName;// only folder name 
57 bi.lpszTitle = "请 选择 MyWebWever 的 根 目录 : "; 

58 bi.ulFlags = BIF_STATUSTEXT; 

59 bi.lpfn = NULL; 

60 bi.lParam = NULL; 

61 bi.ilmage = NULL; 

62 LPITEMIDLIST pidl = SHBrowseForFolder (&bi) ; 

63 if (pid) { 

64 SHGetPathFromIDList(pidl, szDirName) ; 

65 m_strHomeDir = szDirName; 

66 UpdateData (FALSE) ; 

67 } 

68 

69 if(!SHGetMalloc(&lpMalloc) && (lpMalloc != NULL)) 
70 { 

71 if(pidl != NULL) { 

72 1pMalloc->Free (pid1) ; 

73 p 

74 lpMalloc-?Release(); 

75 ) 

76 } 


HMM ML P M M HM M M M M M M M HM M M np MM wg 


在 上 面 的 程序 中 ， 黑 体 字 部 分 是 用 户 代码 ， 其 余 都 由 VC 系统 自动 生成 。 下 面 仅 对 用 户 
代码 进行 分 析 。 

第 16—18 fT COptSetupDlg 类 构造 函数 。 为 成 员 变量 m_strDefaultPage, m strHomeDir 
和 m nSvrPort 赋 初 值 ， 从 全 局 的 COptions 类 对 象 g pSvrOptions 获得 服务 器 参数 。 

第 40—43 行 “确认 ”按钮 的 响应 函数 。 首 先 调用 UpdateData 函数 将 对 话 框 数据 读 取 至 
对 应 的 成 员 变 量 ， 然 后 将 这 些 成 员 变量 的 值 赋 给 g_pSvrOptions。 

第 50~75 fT IDC BUTTON SEL HOMEDIR 按钮 的 响应 函数 。 该 函数 调用 系统 通用 的 
目录 查找 对 话 框 供用 户 选 择 MyWeb 的 根 目 录 ， 并 将 值 赋 给 sttHomeDir 成 员 变量 。 


22.2.3 CMyNotifylcon 类 


该 类 用 于 构建 、 维 护 任务 栏 图 标 ， 主 要 目的 是 为 用 户 提 供 基 于 任务 栏 图 标的 图 形 化 使 用 
界面 。 
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HII M M M HM HM TATA TATA TATA A AAT n n AAA AAT TAT TT 

// MyNotifyIcon.h: CMyNotifyIcon 类 的 接口 说 明 

// Create: 2004-04-06 LastModify: 2004-04-06 

A 
1 #ifndef (AFX MYNOTIFYICON H 501495DD 2ECE 4241 88A2 3A215EC596A1 INCLUDED ) 
2 #define AFX MYNOTIFYICON H 501495DD 2ECE 4241 88A2 3A215ECS96Al INCLUDED 


3 #if MSC VER > 1000 

4 #pragma once 

5 #endif // MSC VER > 1000 

6 class CMyNotifyIcon 

Ww 4 

8 public: 

9 void ChangeIcon(UINT nIDResource, const char *tip); 
10 void DelIcon(); 

11 void AddIcon(UINT nIDResource, const char *tip); 

12 CMyNotifyIcon(HWND hWnd, UINT uCallbackMessage, UINT nID); 
13 virtual ~CMyNotifyIcon (); 


14 protected: 


15 UINT m_nID; 

16 void FillNotifyIconData(UINT nIDResource, const char *tip); 
I NOTIFYICONDATA m niData; 

18 UINT m uCallbackMessage; 

19 HWND m hWnd; 

20 y 

21 #endif 


HH BM M HM M M M M HM M M M M M M M P M I P P P IH PL P gng 


上 面 是 CMyNotifyIcon 类 的 接口 说 明 ， 和 用 户 相 关 的 主要 是 CMyNotifyIcon 的 构造 函数 
以 及 AddIcon、ChangeIcon 5j DelIcon 3 个 public 成 员 函 数 , 这 3 个 函数 分 别 用 于 添加 任务 栏 
图 标 、 切换 任务 栏 图标 和 删除 任务 栏 图 标 ， 所 有 的 操作 都 围绕 函数 系统 函数 Shell NotifyIcon 
进行 。 


AA 
// MyNotifyIcon.cpp: CMyNotifyIcon 类 的 定义 ， 实 现 了 基本 的 任务 栏 图 标 操作 

// Create: 2004-04-06 LastModify: 2004-04-06 

Hull TTT HW WWW HH P P P P P M P P M TTT P AAT TT 
Ll #include "stdafx.h" 

2 #include "MyNotifyIcon.h" 


#ifdef DEBUG 
#undef THIS FILE 

static char THIS FILE[]- FILE ; 
#define new DEBUG NEW 

#endif 


Yn oO Bw 
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EA 
9  // Construction/Destruction 


10. MIU MB OIM M P M M P P MM PL P P ML P UH P ML MU GE 
11 CMyNotifyIcon: :CMyNotifyIcon(HWND hWnd, UINT uCallbackMessage, UINT nID) 


12-4 

13 m hWnd = hWnd; 

14 ASSERT (m hWnd != NULL); 

15 m_nID = nID; 

16 m_uCallbackMessage = uCallbackMessage; 
1 3 


18  CMyNotifyIcon::-CMyNotifyIcon|() 
19 { 
20 } 


21 void CMyNotifyIcon::AddIcon(UINT nIDResource, const char *tip) 


22. 1 
23 FillNotifyIconData (nIDResource, tip); 
24 Shell NotifyIcon(NIM ADD, &m niData); 
25 ] 


26 void CMyNotifyIcon::ChangeIcon(UINT nIDResource, const char *tip) 


27 1 

28 FillNotifyIconData (nIDResource, tip); 

29 Shell NotifyIcon(NIM MODIFY, &m niData); 
30 ] 


31 void CMyNotifyIcon: :DelIcon() 


32 4 
33 Shell NotifyIcon(NIM DELETE, &m niData); 
34 ] 


35 void CMyNotifyIcon::FillNotifyIconData (UINT nIDResource, const char *tip) 


36 ( 

37 HICON hIcon = AfxGetApp ()-»LoadIcon (nIDResource); 
38 memset(&m niData, 0, sizeof (NOTIFYICONDATA) ); 

39 m_niData.cbSize = sizeof (NOTIFYICONDATA) ; 

40 m_niData.hIcon = hIcon; 

41 m_niData.hWnd = m_hWnd; 

42 sprintf (m_niData.szTip, tip); 

43 m_niData.uCallbackMessage = m_uCallbackMessage; 
44 m niData.uFlags = NIF ICON | NIF MESSAGE | NIF TIP; 
45 m niData.uID = m nID; 

46 ] 


HMM B gH M TATA P P P P P P P P PP P PM LL P LM P ML P P HL BM 


第 11—17 ff CMyNotifyIcon 类 的 构造 函数 ， 在 构造 函数 中 传 入 3 个 参数 : hWnd、 
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uCallbackMessage 和 nID， 分 别 是 使 用 任务 栏 图 标的 应 用 程序 的 窗口 句柄 、 任 务 栏 图 标 鼠 标 
事件 的 回调 用 户 消 息 ( 当 有 上 鼠标 事件 发 生 时 ， 系 统 会 自动 将 这 个 用 户 定义 消息 
uCallbackMessage 发 送 给 窗 体 hWnd) 和 任务 栏 图 标的 ID。 

第 21—25 íF AddIcon，public 成 员 函 数 ， 添 加 任务 栏 图 标 。 函 数 有 两 个 输入 参数 : 
nIDResource 和 tip， 分 别 是 图 标 资源 的 ID 号 和 鼠标 停留 在 任务 栏 图 标 上 时 显示 的 提示 信息 。 

口 “23 行 ， 函 数 调用 protected 成 员 函 数 FillNotifyIconData 填充 NOTIFYICONDATA 类 

型 成 员 变量 m_niData。 

O 24 行 ， 调 用 系统 函数 Shell NotifyIcon， 指 令 参 数 为 NIM_ADD。 

第 26—30 行 ChangeIcon，public 成 员 函 数 ， 更 改 当前 的 任务 栏 图 标 。 参 数 与 流程 都 与 
Addlcon 一 致 ， 只 是 在 调用 系统 函数 Shell NotifyIcon 时 指令 参数 为 NIM_MODIFY。 需 要 注 
意 的 是 用 户 必 须 首先 AddIcon， 然 后 才能 ChangeIcon。 

第 31 一 34 行 DelIcon，public 成 员 函 数 ， 删 除 任务 栏 图 标 ， 同 上 ，Shell NotifyIcon 指令 
参数 为 NIM_DELETE。 

第 35 一 46 íF FillNotifyIconData, protected 成 员 函 数 ， 填 充 NOTIFYICONDATA 类 型 成 
员 变 量 m_niData。 


22.24 CHttpServer 类 


CHttpServer 类 是 MyWeb 项 目的 核心 模块 ， 由 它 提 供 全 部 的 WWW 核心 服务 ， 包 括 接 
受 客户 端 连接 、 解 析 HTTP 请 求 信息 、 返 回应 答 等 。 代 码 涉及 到 完成 端口 、 线 程 同步 、C++ 
标准 模板 库 (STL ) 等 的 使 用 , 希望 读者 在 阅读 这 部 分 代码 之 前 , 对 这 些 知 识 点 有 一 定 的 T 
解 。 

首先 分 析 CHttpServer 类 的 头 文件 HttpServerh， 源 码 如 下 : 


MAAN 
// HttpServer.h: CHttpServer 类 的 接口 说 明 

// Create: 2004-03-23 By: yangming 

// LastModify: 2004-04-05 By: yangming 
AA 
1 #if !defined(AFX HTTPSERVER H 1A372664 7D4F 430C AD6D 2B26CC4CB967 INCLU 

DED ) 
2 #define AFX HTTPSERVER H 1A372664 7D4F 430C AD6D 2B26CC4CB967 INCLUDED 


3 #if MSC VER > 1000 
#pragma once 
5  £endif // MSC VER > 1000 


// The debugger can't handle symbols more than 255 characters long. 

// STL often creates symbols longer than that. 

// When symbols are longer than 255 characters, the warning is disabled. 
#pragma warning (disable:4786) 


0-0 


10 #include «WINSOCK2.H» 
11 #include «STRING» 
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12  #include «MAP» 
13 using namespace std; 


14 #define MAX SERVICETHREAD NUM 8 


15 #define WAIT4THREAD MILLISECS 3000 

16 define MAX BUF LEN 1000 

17 define MAX HTTP REQUEST LEN 1000 

18 define WEBSERVER NAME "MyWeb" 

19 #define ERROR404 string ("\\E404.htmL") 
20 #define ERROR501 string ("\\E501.html") 
21 #define WM USER CLIENT WM USER + 1 

22 #define CLIENT CONN REQ 0 


23 #define CLIENT ACCEPT 1 

24 #define CLIENT REJECT 2 

25 #define CLIENT DISCONNECT 3 

26 define CLIENT FAIL CLOSE 4 

27 typedef enum{ 

28 SERVER STOP, SERVER RUNNING, SERVER PAUSE 
29 } ServerState; 


30 typedef map<string, string» MIMETYPES; 


3l — JJOO XKOOOOOOGIOROOIOOIOIOEOOIOIOROOEOOEOOOOO ROO OOOOOOOOOOOEOOR TEAR IIIA A IIIA / 
2 typedef enum IO OPER{ 

33 SVR IO READ, 

34 SVR IO WRITE 

35 } IO OPER, *LPIO OPER; 


36 // 扩展 重重 结构 体 ， 单 I/o 数据 
37 typedef struct _OverLappedEx{ 


38 OVERLAPPED OverLapped; 

39 WSABUF wbuf; 

40 char data[MAX BUF LEN]; 
41 IO OPER oper; 

42 DWORD flags; 


43 } PER IO DATA, *LPPER IO DATA; 


44  // 完成 键 结构 体 ， 单 句柄 数据 ， 对 应 每 个 服务 套 接口 一 每 个 连接 
45 typedef struct CONN CTX( 


46 SOCKET sockAccept; 
47 LPPER IO DATA pPerIOData; 
48 string szRequest; 
49 string szResponse; 
50 BOOL bKeepAlive; 


51 DWORD nAlreadyResponsed; 


52 
53 
54 
55 
56 
57 


58 
59 
60 
61 
62 
63 
64 
65 
66 


67 
68 
69 
70 
71 
72 


73 
74 
75 
76 
T? 
78 
79 


80 
81 
82 


83 
84 
85 


86 
87 
88 


89 
90 
91 
92 
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struct _CONN CTX *pPrec; 

struct _CONN CTX *pNext; 

.CONN CTX() { pPerIOData = (LPPER IO DATA) malloc (sizeof (PER IO DATA));}; 
^ CONN CTX()( free (pPerIOData) ; }; 


) CONN CTX, *LPCONN CTX; 
JACO de kekeke ede kejele ke ieje jeje Ie jejeje ejje Ie ROIOI OR JR ReRe OG Rejeje ee jejeje eei joie eeieie eee ek / 


class CHttpServer 


t 


public: 


BOOL StartServer(); 

BOOL PauseServer(); 

BOOL StopServer(); 
ServerState GetServerState(); 
CHttpServer(); 

virtual ~CHttpServer (); 


protected: 


HANDLE m_evtSvrToStop; 
HANDLE m_evtThreadLanched; 
HANDLE m hIOCP; 
HANDLE m hThreadList[MAX SERVICETHREAD NUM + 2]; 
// MAX SERVICETHREAD NUM Service Thread, one ListenThread & one 
AdminThread 
ServerState m ServerState; 
SOCKET m sdListen; 
LPCONN CTX m ptrConnctxHead; // 双向 链表 ， 用 于 保存 服务 器 所 有 连接 信息 
BOOL m bSvrPaused; 
CRITICAL SECTION m CriticalSection; 
MIMETYPES m MimeTypes; 
UINT m nSvcThreadNum; 


protected: 


H 


void InitMimeTypes(); 

BOOL ProcessRequest(string szRequest, string &szResponse, BOOL 
&bKeepAlive); 

BOOL IsRequestCompleted (string szRequest); 

void ResetAll(); 

LPCONN CTX CreateConnCtx(SOCKET sockAccept, HANDLE hlOCP); // 创建 连接 数 
据 信息 

void ConnListAdd (LPCONN CTX lpConnCtx); 

void ConnListRemove (LPCONN CTX lpConnCtx); 

void ConnListClear(); 


static DWORD WINAPI ListenThread(LPVOID pParam); 
static DWORD WINAPI ServiceThread(LPVOID pParam); 
static DWORD WINAPI AdminThread(LPVOID pParam); 
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93 extern CHttpServer *g pHttpServer; 


94 #endif 
AMAA 


第 9 行 在 本 节 开 始 部 分 ， 我 们 说 过 CHttpServer 应 用 了 C++ 的 标准 模板 库 。 由 于 STL 创 
建 了 许多 长 符号 (symbols) ， 而 VC 调试 器 仅 能 处 理 不 多 于 255 个 字符 的 符号 ， 因 此 在 编译 
应 用 了 STL 的 项 目 时 ,会 产生 大 量 的 编码 为 4786 的 警告 信息 。 解 决 的 方法 如 下 : 在 include 
所 需 的 STL 库 之 前 ， 首 先 通过 pragma 设 定编 译 选项 以 禁止 4786 警告 。 

第 11 一 13 行 包含 STL 中 string 和 map 头 文件 ， 并 设 定 std 名 字 空 间 。 

第 14—20 行 定义 了 若干 常量 。 其 中 MAX SERVICETHREAD NUM (=8) 表示 服务 器 
最 多 只 启动 8 个 服务 线程 ，WAIT4THREAD MILLISECS (=3000) 用 于 线程 间 的 同步 ， 表 示 
线程 A 在 等 待 线程 B 触发 某 事 件 对 象 时 ， 最 多 只 等 待 3 秒 钟 〈 或 若干 个 3 秒 钟 ， 详 见 
CHttpServer 的 实现 ) ; MAX BUF LEN (=1000) ， 表 示 MyWeb 服务 器 每 次 最 多 接收 客户 
端 传 来 的 1000B 数据 MAX HTTP REQUEST LEN (=1000) ， 表 示 MyWeb 接受 的 客户 端 
HTTP 请 求 最 大 长 度 为 1000B; WEBSERVER_NAME (="MyWeb") ， 用 于 构造 HTTP 的 
Response 信息 ,表示 服务 器 名 为 MyWeb; ERROR404 (=string("\\E404.html")) 和 ERRORSOI 

(=string("\E501.html")) 用 于 指定 当 客户 端 请 求 发 生 404 或 者 501 HIRT, MyWeb 服务 器 
所 反馈 的 页 面 。 

第 21—26 行 同样 定义 了 若干 常量 。 我 们 知道 , 每 一 个 Windows 消息 都 带 有 三 部 分 数据 : 
消息 码 、WPARAM fil LPARAM. “4 MyWeb 服务 过 程 中 发 生 了 某 些 与 HTTP 客户 端 相关 的 
事件 时 ，CMyHttpServer 模块 会 自动 向 主 窗 体 发 送 WM_USER_CLIENT 消息 ， 并 且 将 
CLIENT CONN REQ. CLIENT ACCEPT, CLIENT REJECT、 CLIENT DISCONNECT 以 
及 CLIENT FAIL CLOSE 作为 LPARAM 发 送 (客户 端 IP 信息 作为 WPARAMO ; 这 些 
CLIENT XXX 常量 分 别 表示 有 客户 端 发 起 连接 请 求 、 接 受 连 接 、 拒 绝 连接 、 客 户 端 关 闭 连 
接 以 及 有 错误 发 生 服务 器 切断 连接 等 。 

第 27—29 行 定 义 了 枚 举 类 型 ServerState， 用 于 表示 服务 器 的 3 个 基本 状态 : SERVER_ 
STOP、SERVER_RUNNING 和 SERVER_PAUSE。 

第 30 行将 map<string, string> 定 义 为 MIMETYPES 类 型 。 

第 32 一 35 行 定义 了 枚 举 类 型 IO_OPER， 对 应 于 读 / 写 两 种 操作 。 

第 37 一 43 行 定 义 了 完成 端口 模型 中 的 单 IO 操作 数据 结构 ， 该 结构 与 程序 21.3 中 的 定 
义 完 全 一 致 ， 简 述 如 下 : OverLapped, BAA; wbuf， 用 于 本 次 VO 操作 的 WSABUF 
结构 ; data， 实 际 的 用 户 VO 缓冲 区 , 在 MyWeb 系统 中 仅 用 于 接收 操作 ; oper， 用 于 标志 VO 
操作 的 类 型 ，flags， 用 于 设置 IO 操作 的 参数 。 在 CHttpServer 模块 中 ，PER_IO_DATA 依然 
作为 普通 的 结构 体 进行 操作 ， 这 与 下 面 的 完成 键 有 所 不 同 。 

第 45 一 56 行 完 成 键 结构 。 该 结构 与 程序 21.3 中 的 定义 有 较 大 差别 ， 最 明显 的 是 此 处 的 
结构 体 包含 了 构造 函数 和 析 构 函数 ， 此外， 在 程序 21.3 中 ,完成 键 结构 体 的 内 存 处 理工 作 由 
malloc/free 函数 完成 ， 而 在 CHttpServer 模块 中 由 new/delete 函数 完成 。 事实 上 ,在 前 面 的 定 
义 中 LPCONN_CTX 是 指向 一 块 内 存 区 的 指针 ， 而 在 此 处 是 类 CONN_CTX 的 对 象 指针 。 
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46 行 ，sockAccept， 用 于 保存 此 连接 对 应 的 服务 套 接口 描述 字 。 

47 行 ，pPerIOData， 指 向 单 VO 操作 结构 的 指针 ， 用 于 保存 每 次 VO 操作 的 基本 信 
息 和 数据 .该 指针 所 指向 的 内 存 区 的 分 配 和 释放 工作 由 _CONN_CTX 的 构造 / 析 构 函 
数 完成 。 

48 一 49 行 ， 两 个 string 类 型 的 成 员 变量 ， 其 中 szRequest 用 于 保存 HTTP 请 求 信息 ， 
szResponse 用 于 保存 服务 器 对 请 求 的 响应 数据 。string 类 由 STL 提供 ， 包 含 erase、 
size 等 成 员 函 数 。 正 是 因为 在 CONN_CTX 中 包含 了 string 类 型 的 成 员 变 量 , 不 能 使 
用 malloc/free 函数 来 为 LPCONN_CTX 指针 分 配 内 存 (否则 将 导致 内 存 溢 出 ， 
szRequest 和 szResponse 无 法 正常 释放 资源 ), CHttpServer 模块 才 将 CONN_CTX 当 
作 类 来 处 理 。 

50 行 ，bKeepAlive 用 于 指明 该 连接 是 否 需要 保持 ， 参 见 相关 的 REC 文档 。 

51 行 ， 由 于 HTTP 的 响应 信息 数据 量 较 大 ， 可 能 需要 多 次 WSASend 调用 才能 发 送 
完毕 ， 成 员 变 量 nAlreadyResponsed 用 于 记录 当前 连接 对 当前 请 求 已 发 送 的 响应 数 
据 量 。 

52 一 53 行 ， CONN_CTX 类 指针 ， 用 于 构造 包含 当前 所 有 连接 的 CONN_CTX 双向 
链表 。 

54—55 ff, CONN CTX 的 构造 / 析 构 函数 ， 在 构造 函数 中 ， 调 用 了 malloc 函数 为 
pPerlOData 分 配 内 存 ; 在 析 构 函数 中 ， 调 用 free 释放 内 存 。 因 此 pPerIOData 的 内 存 
处 理 是 在 CONN_CTX 对 象 创 建 和 释放 时 自动 进行 的 。 这 一 点 与 程序 21.3 不 同 , 在 
21.3 中 , 必须 显 式 地 按 一 定 顺序 分 别 为 LPPER_IO_DATA fil LPCONN CTX 类 型 指 
针 调 用 malloc/free 函数 。 


第 58—92 ÍF CHttpServer 类 定义 。 主 要 分 为 三 段 ，60 一 66 行 ， 是 类 的 public 成 员 函 数 ， 
用 户 使 用 接口 ; 67 一 79 行 ， 类 的 protected 成 员 变量 ; 80 一 91 行 ， 类 的 protected MAHA, 
供 类 内 部 调用 。 

第 60~66 行 CHttpServer 的 public 成 员 函 数 。 


口 


口 


a 


a 


61 47, StartServer, public 成 员 函 数 ， 用 于 启动 MyWeb 服务 。 如 果 函 数 调 用 返回 
TRUE， 说 明 服 务 成 功 启动 ; 如 果 返 回 FALSE， 则 需要 根据 服务 器 的 当前 状态 来 判 
断 ， 有 两 种 情况 : O 服务 器 原本 就 处 于 运行 态 ，@ 服务 器 启动 失败 。 

62 行 ，PauseServer，public 成 员 函 数 ， 用 于 暂停 服务 。 如 果 函 数 调用 返回 TRUE, 
说 明 服务 已 暂停 ， 如 果 返 回 FALSE， 说 明 服 务 器 原本 就 处 于 暂停 或 者 停止 状态 。 
63 行 ，StopServer，public 成 员 函 数 ， 用 于 停 目 服务。 如果 函数 调用 返回 TRUE， 说 
明 服 务 成 功 停 止 ， 如 果 返 回 FALSE， 说 明 服务 器 原本 就 处 于 停止 状态 。 

64 行 , GetServerState 用 于 返回 服务 器 的 当前 状态 , 返回 类 型 为 ServerState, 枚 举 型 ， 
WU 27~29 行 。 


第 67 一 79 行 CHttpServer 的 protected 成 员 变 量 。 


口 


68~69 ÍT, m evtSvrToStop 和 m evtThreadLanched, protected 成 员 变 量 。 事件 对 象 ， 
用 于 线程 同步 。 其 中 evtSvrToStop 用 于 通知 管理 线程 LFX) 停止 MyWeb ARS; 
m_evtThreadLanched 用 于 通知 线程 已 成 功 启动 。 

70 行 ，m_hIOCP， 完 成 端口 句柄 。 
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a 


a 


71~72 íf, m hThreadList [MAX SERVICETHREAD NUM + 2], protected 成 员 变 
量 ， 用 于 保存 在 CHttpServer 模块 中 启动 的 所 有 线程 的 句柄 ， 包 含 最 多 
MAX SERVICETHREAD NUM 个 服务 线程 ， 一 个 监听 线程 和 一 个 管理 线程 。 

73 行 ，m_ServerState，protected 成 员 变量 ， 用 于 保存 服务 器 的 当前 状态 。 

7447, m sdListen, protected 成 员 变 量 ，MyWeb 服务 器 的 惟一 的 一 个 监听 套 接口 。 
75 fT, m ptrConnCtxHead, protected 成 员 变 量 ， 与 程序 21.3 相同 ，MyWeb 服务 器 
在 运行 过 程 中 会 维护 一 个 包含 当前 全 部 HTTP 客户 端 连接 信息 的 双向 链表 ， 而 
m ptrConnCtxHead 正 是 用 来 保存 该 链表 地 址 信息 的 指针 。 

76 行 ，m_bSvrPaused，protected 成 员 变 量 ，BOOL Æ, TRUE 表示 服务 器 处 于 暂停 
状态 ，FALSE 表示 处 于 非 暂 停 状态 。 

77 行 ，m_CriticalSection，protected 成 员 变 量 ， 用 于 线程 互 斥 访问 临界 资源 ， 在 
CHttpServer 模块 中 主要 是 连接 信息 链表 。 

78 47, m MimeTypes, protected 成 员 变量 ，MIMETYPES ( 即 map<string, string» 
类 型 ， 用 于 保存 文件 后 级 名 与 MIME 类 型 之 间 的 映射 关系 。 

79 ff, m nSvcThreadNum, protected 成 员 变量 ， 用 于 保存 MyWeb 服务 器 运行 时 实 
际 启动 的 服务 线程 数 。 


第 80~91 fT CHttpServer 的 protected 成 员 函 数 。 


a 


a 


8117, InitMimeTypes, protected 成 员 函 数 ， 给 m. MimeTypes 成 员 变量 赋值 ， 建 立 
文件 后 级 名 与 MIME 资源 类 型 之 间 的 对 应 关系 。 

82 行 ，ProcessRequest，protected 成 员 函 数 ， 用 于 处 理 客 户 端 传 来 的 HTTP 请 求 
szRequest。 函 数 有 3 个 输入 参数 : szRequest 表示 HTTP 请 求 ，szResponse 的 引用 ， 
用 于 保存 响应 数据 ，bKeepAlive 的 引用 ， 用 于 保存 Connection: Keep-Alive 选项 值 。 
当前 版 本 的 ProcessRequest 函数 的 实现 的 返回 值 总 为 TRUE。 

83 fT, IsRequestCompleted, protected 成 员 函 数 。 用 于 判断 HTTP 请 求 szRequest 是 
否 已 完整 (接收 完毕 )， 如 果 已 完整 则 返回 TRUE， 否 则 返回 FALSE。 

84 行 ，ResetAll，protected 成 员 函 数 。 该 函数 负责 将 系统 中 的 所 有 成 员 变 量 全 部 复 
位 ， 并 释放 运行 态 时 占用 的 资源 。 一 般 用 于 服务 器 的 初始 化 或 者 重启 。 

85 行 , CreateConnCtx, protected 成 员 函 数 。 完 成 两 个 工作 , 一 是 将 套 接口 sockAccept 
与 完成 端口 HOCP 绑 定 ， 二 是 为 新 到 来 的 客户 端 连接 创建 CONN_CTX 数据 ， 该 连 
接 可 由 sockAccept 标志 。 

86 fT, ConnListAdd, protected 成 员 函 数 。 将 新 到 来 的 连接 对 应 的 CONN_CTX 数 
据 IpConnCtx 加 入 到 CHttpServer 模块 维护 的 连接 信息 链表 。 

87 行 ，ConnListRemove，protected 成 员 函 数 。 将 某 个 连接 对 应 的 CONN_CTX 数据 
IpConnCtx 从 CHttpServer 模块 维护 的 连接 信息 链表 中 删 去 ， 同 时 关闭 连接 并 释放 
资源 。 

88 行 ，ConnListClear，protected 成 员 函 数 。 清 除 连接 信息 链表 ， 关 闭 所 有 连接 。 
89~91 行 ，ListenThread/ServiceThread/AdminThread， 这 3 个 函数 既是 CHttpServer 
类 的 protected 成 员 函 数 ， 又 是 线程 函数 。 需 要 注意 的 是 ， 类 的 成 员 函 数 要 作为 线程 
函数 , 必须 是 静态 的 并 且 带 有 WINAPI 描述 符 . 而 又 因为 ListenThread/ServiceThread 
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/AdminThread 是 静态 函数 ， 所 以 在 这 3 个 函数 中 无 法 使 用 this 指针 ， 也 就 无 法 访问 
类 的 非 静态 成 员 变 量 或 者 调用 非 静态 成 员 函 数 。 解 决 的 方法 是 将 this 指针 作为 线程 
函数 的 输入 参数 pParam 传 入 。 其 中 ListenThread 是 CHttpServer 模块 的 监听 线程 ， 
负责 接收 外 来 的 连接 请 求 ，ServiceThread 是 服务 线程 ， 由 它 具体 接收 并 处 理 客户 端 
发 送 的 HTTP 请 求 ， AdminThread 是 管理 线程 ， 该 线程 接收 服务 器 停止 信号 ， 并 负 
责 服 务 器 的 停止 、 复 位 工作 。 

下 面 是 CHttpServer 类 的 实现 源码 : 


HB LL B MM HL M P M P I P P P P P P P PP M P P M P P M P MM gU 
// BttpServer.cpp: CHttpServer 类 的 实现 ， 完 成 了 基于 IOCP 的 简单 的 www 服务 功能 

// Create: 2004-03-23 By: yangming 

// LastModify: 2004-04-05 By: yangming 

HB IM HH P P M P P P P MIB LL AAA TAA AT TTT TATA 
1 #include "stdafx.h" 

2 #include "MyWebServer.h" 

3 #include "HttpServer.h" 

4 #include "Options.h" 


#ifdef _DEBUG 
fundef THIS FILE 

static char THIS FILE[]- FILE ; 
#define new DEBUG NEW 

#endif 


oo ~au 


10 CHttpServer _HttpServer; 
11 CHttpServer *g pHttpServer = & HttpServer; 


12 // 创建 1/0 完成 端口 

13 #define CreateNewIoCompletionPort (dwNumberOfConcurrentThreads) 
CreateloCompletionPort (INVALID HANDLE VALUE, NULL, 0, 
dwNumberOfConcurrentThreads) 

14  // 将 套 接口 与 完成 端口 绑 定 

15 #define AssociateWithIoCompletionPort (hComPort, hDevice, dwCompKey) 
CreateloCompletionPort (hDevice, hComPort, dwCompKey, 0) 


16 /HMHTMMMMMB BI TATA TT TTT P M P P P TATA TAA TTT 
17 // Construction/Destruction 


18 MM MM I I I M HI TATA P P P P P Pg B HH M MM Mg gg 


19 CHttpServer: :CHttpServer () 


20. 1 

21 m_evtThreadLanched = CreateEvent (NULL, FALSE, FALSE, NULL); 
22 m_evtSvrToStop = CreateEvent (NULL, FALSE, FALSE, NULL); 

23 InitializeCriticalSection(&m CriticalSection); 

24 ResetAll(); 


25 SYSTEM INFO sysInfo; 


TCP/IP 协议 及 网 络 编程 技术 


GetSystemInfo (&sysInfo) 7 

// t sysInfo.dwNumberOfProcessors*2 #fl MAX_SERVICETHREAD NUM 之 间 的 较 小 值 赋 
给 m_nsvcThreadNum 

m nSvcThreadNum- sysInfo.dwNumberOfProcessors *2«MAX SERVICETHREAD NUM? 
(sysInfo.dwNumberOfProcessors * 2) : MAX SERVICETHREAD NUM; 


InitMimeTypes(); 


CHttpServer: :~CHttpServer () 


{ 


CloseHandle (m_evtThreadLanched) ; 
CloseHandle (m evtSvrToStop); 
DeleteCriticalSection(&m CriticalSection); 


BOOL CHttpServer: :StartServer () 


{ 


if(m_ServerState 一 SERVER_RUNNING) 
return FALSE; 

if(m_ServerState == SERVER_PAUSE) { 
m_bSvrPaused = FALSE; 
m_ServerState = SERVER_RUNNING; 
return TRUE; 

} 

m_bSvrPaused = FALSE; 


// Step.1 初始 化 Winsock 

WSAData wsaData; 

if(WSAStartup(WINSOCK VERSION, &wsaData) != 0) 
return FALSE; 

ResetAll(); 


// Step.2 启动 管理 线程 ， 该 线程 负责 服务 器 的 关闭 工作 
HANDLE hThread = CreateThread(NULL, 0, AdminThread, this, 0, NULL); 
if (hThread == NULL) { 
WSACleanup () ; 
ResetAll(); 
return FALSE; 
H 
// 等 待 管理 线程 正常 运行 
if (WaitForSingleObject (m_evtThreadLanched, WAIT4THREAD MILLISECS) != 
WAIT OBJECT 0){ 
TerminateThread (hThread, 1); 
CloseHandle (hThread) ; 
WSACleanup(); 
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66 
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69 


70 
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72 
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76 
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ResetAll(); 
return FALSE; 


m hThreadList[0] = hThread; 


// Step.3 启动 监听 线程 
ResetEvent (m_evtThreadLanched) ; 
hThread = CreateThread(NULL, 0, ListenThread, this, 0, NULL); 
if (hThread == NULL) { 
// 通知 管理 线程 结束 
SetEvent (m_evtSvrToStop) ; 
// 等 待 管理 线程 结束 
if (WaitForSingleObject (m_hThreadList [0], WAIT4THREAD MILLISECS * 3) ! 
= WAIT_OBJECT_0) 
TerminateThread (m hThreadList[0], 1); 
CloseHandle (m hThreadList[0]); 
WSACleanup(); 
ResetAll(); 
return FALSE; 
) 
// 等 待 监听 线程 正常 运行 
if (WaitForSingleObject (m_evtThreadLanched, WAIT4THREAD MILLISECS) != 
WAIT_OBJECT_0) { 
TerminateThread (hThread, 1); 
CloseHandle (hThread) ; 
SetEvent (m_evtSvrToStop) ;// 通知 管理 线程 结束 
if (WaitForSingleObject (m hThreadList[0], WAIT4THREAD MILLISECS * 
3) !- WAIT OBJECT 0) 
TerminateThread (m hThreadList[0], 1); 
CloseHandle (m hThreadList[0]); 
WSACleanup(); 
ResetAll(); 
return FALSE; 


m hThreadList[1] = hThread; 
m ServerState = SERVER RUNNING; 


return TRUE; 


BOOL CHttpServer::PauseServer () 


t 


if(m ServerState != SERVER RUNNING) 
return FALSE; 
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130 
131 


132 
133 
134 
135 
136 
137 
138 
139 
140 
141 
142 
143 
144 
145 


m bSvrPaused = TRUE; 
m ServerState — SERVER PAUSE; 


return TRUE; 


BOOL CHttpServer: :StopServer () 


t 


if(m ServerState — SERVER STOP) 
return FALSE; 


SetEvent (m evtSvrToStop); 
// 等 待 管理 线程 结束 
WaitForSingleObject (m hThreadList[0], WAIT4THREAD MILLISECS * 3); 
DWORD nExitCode; 
GetExitCodeThread (m hThreadList[0], &nExitCode); 
if(nExitCode — STILL ACTIVE) 
TerminateThread (m hThreadList[0], 1); 


ResetAll(); 
WSACleanup(); 


return TRUE; 


ServerState CHttpServer::GetServerState() 


i 


return m ServerState; 


Hull HW HH HH HH TAT TATA P P LH P I n P g g 
HUllJHAHUUL LL L L B I | P P n n lb nn 


void CHttpServer::InitMimeTypes() 


{ 


// Init MIME Types 


m_MimeTypes ["doc"] = "application/msword"; 
m_MimeTypes ["bin"] = "application/octet-stream"; 
m MimeTypes ["dll"] = "application/octet-stream"; 
m MimeTypes["exe"] = "application/octet-stream"; 
m MimeTypes ["pdf"] = "application/pdf"; 

m MimeTypes ["p7c"] — "application/pkcs7-mime"; 

m MimeTypes["ai"] = "application/postscript"; 

m MimeTypes["eps"] = "application/postscript"; 

m MimeTypes["ps"] = "application/postscript"; 

m MimeTypes["rtf"] — "application/rtf"; 

m MimeTypes["fdf"] = "application/vnd.fdf"; 


146 
147 
148 
149 
150 
151 
152 
153 
154 
155 
156 
157 
158 
159 
160 
161 
162 
163 
164 
165 
166 
167 
168 
169 
170 
171 
172 
173 
174 
175 
176 
177 
178 
179 
180 
181 
182 
183 
184 
185 
186 
187 
188 
189 
190 
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192 
193 


m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 
m MimeTypes 


"arj"] 
"gz"] 
"class"] 
el | 
"lzh"] 
"1nk"] 
"tar"] 
"hlp"] 
"cert"] 
"zip"] 
"cab"] 
"arj"] 
"aif"] 
"aifc"] 
"aiff"] 
"au"] 
"snd"] 
"mid"] 
"rmi"] 
"mp3"] 
"vox"] 
"wav"] 
*ra"] 
"ram"] 
"bmp"] 
"gif"] 
"jpeg"] 
"jpg"] 
"tif"] 
"tiff") 
"xbm"] 
"wrl"] 
"htm"] 
"html"] 
"ry 
"cpp"] 
"def"] 
hn] 
"ExE"] 
"rtx"] 
arte") 
"java"] 
"css"] 
"mpeg"] 
"mpg"] 
"mpe"] 
"avi"] 


"mov"] 
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"application/x-arj"; 
"application/x-gzip"; 
"application/x-java-class"; 
"application/x-javascript"; 
"application/x-lzh"; 
"application/x-ms-shortcut"; 
"application/x-tar"; 
"application/x-winhelp"; 
"application/x-x509-ca-cert"; 
"application/zip"; 
"application/x-compressed"; 
"application/x-compressed"; 
"audio/aiff"; 

"audio/aiff"; 

"audio/aiff"; 

"audio/basic"; 
"audio/basic"; 

"audio/midi"; 

"audio/midi"; 

"audio/mpeg"; 
"audio/voxware"; 
"audio/wav"; 
"audio/x-pn-realaudio"; 
"audio/x-pn-realaudio"; 


"image/tiff"; 
"image/tiff"; 


"jmage/xbm"; 
"model/vrml" 


"text/plain"; 
"text/plain"; 
"text/plain"; 
"text/plain"; 
"text/plain"; 
"text/richtext"; 
"text/richtext"; 
"text/x-java-source"; 
"text/css"; 
"video/mpeg"; 
"video/mpeg"; 
"video/mpeg"; 
"video/msvideo"; 
"video/quicktime"; 
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194 m_MimeTypes ["qt"] = "video/quicktime"; 
195 m MimeTypes ["shtml"] = "wwwserver/html-ssi"; 
196 m MimeTypes ["asa"] = "wwwserver/isapi"; 
197 m MimeTypes["asp"] — "wwwserver/isapi"; 


198 m MimeTypes ["cfm"] = "wwwserver/isapi 
199 m MimeTypes ["dbm"] = "wwwserver/isap: 
200 m MimeTypes["isa"] = "wwwserver/isap: 
201 m MimeTypes ["plx"] = "wwwserver/isapi"; 
202 m MimeTypes ["url"] = "wwwserver/isapi"; 
203 m MimeTypes ["cgi"] = "wwwserver/isapi"; 
204 m MimeTypes ["php"] = "wwwserver/isapi"; 
205 m_MimeTypes ["wcgi"] = "wwwserver/isapi"; 
206 } 


207 void CHttpServer::ResetAll() 


208 ( 

209 m ServerState = SERVER STOP; 

210 m sdListen = INVALID SOCKET; 

21 for(int i = 0; i < MAX SERVICETHREAD NUM + 2; i++) { 
212 if(m hThreadList[i]) 

213 CloseHandle (m hThreadList[i]); 
214 m hThreadList[i] = NULL; 

215 } 

216 if (m_hIOCP) { 

217 CloseHandle (m_hIOCP) ; 

218 m hIOCP = NULL; 

219 J 

220 if (m_ptrConnCtxHead) 

221 ConnListClear (); 

222 ResetEvent (m_evtThreadLanched) ; 

223 ResetEvent (m_evtSvrToStop) ; 

224 m_bSvrPaused = FALSE; 

225 m_ptrConnCtxHead = NULL; 

226 } 


227 HAMM Mg LL ML P B TATA TTA P P TATA AAA TATA TT 
228 [JM M I BM HM MB M LL I P P I I 


229 BOOL CHttpServer::IsRequestCompleted(string szRequest) 


230 ( 

231 if(szRequest.size() « 4) 

232 return FALSE; 

233 

234 if(szRequest.substr(szRequest.size() - 4, 4) == "\r\n\r\n") 
235 return TRUE; 

236 else 

237 return FALSE; 


238 ] 
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239 BOOL CHttpServer::ProcessRequest (string szRequest, string &szResponse, BOOL 


&bKeepAlive) 
240 { po 
241 string szMethod; 
242 string szFileName; 
243 string szFullPathName; 
244 string szFileExt; 
245 string szStatusCode ("200 OK"); 
246 string szContentType ("text/html"); 
247 string szConnectionType ("close"); 
248 string szNotFoundMessage; 
249 string szDateTime; 
250 char pResponseHeader [2048] ; 
251 fpos t lengthActual - 0, length - 0; 
252 char *pBuf = NULL; 
253 int n; 
254 
255 // Check Method 
256 n = szRequest.find(" ", 0); 
257 if(n != string: :npos) { 
258 szMethod = szRequest.substr(0, n); 
259 if (szMethod == "GET") { 
260 // Get file name 
261 int nl = szRequest.find(" ", n + 1); 
262 if(nl !- string: :npos) { 
263 szFileName = szRequest.substr(n + 1, nl - n - 1); 
264 // do some check 
265 nl = szFileName.find("..", 0); 
266 if (nl != string: :npos) { 
267 szStatusCode = "404 Resource not found"; 
268 szFileName = ERROR404; 
269 } 
270 if (szFileName == "/") 
271 szFileName = string(g pSvrOptions-»m szDefaultPage); 
272 } 
273 else{// No 'space' found in Request String 
274 szStatusCode = "501 Not Implemented"; 
275 szFileName = ERRORSO1; 
276 } 
277 } 
278 else{ 
279 szStatusCode = "501 Not Implemented"; 
280 szFileName = ERROR501; 
281 } 
282 } 
283 else(// "No 'space' found in Request String 


284 szStatusCode = "501 Not Implemented"; 
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285 szFileName = ERROR5017 

286 } 

287 // Determine Connection type 

288 n = szRequest.find("\nConnection: Keep-Alive", 0); 

289 if(n != string: :npos) 

290 bKeepAlive = TRUE; 

291 else 

292 bKeepAlive = FALSE; 

293 // Figure out content type 

294 int nPointPos = szFileName.rfind("."); 

295 if (nPointPos string: :npos) { 

296 szFileExt = szFileName.substr(nPointPos + 1, szFileName.size()); 
297 strlwr((char*)szFileExt.c str()); 

298 MIMETYPES::iterator it; 

299 it - m MimeTypes.find(szFileExt); 

300 if(it !- m MimeTypes.end()) 

301 szContentType = (*it).second; 

302 } 

303 // Obtain current GMT date/time 

304 char szDT[128]; 

305 struct tm *newtime; 

306 long ltime; 

307 time (&ltime); 

308 newtime = gmtime(&ltime); 

309 strftime(szDT, 128, "$a, %d tb %Y %H:%M:%S GMT", newtime); 
310 // Read the file 

311 FILE *f; 

312 szFullPathName = string(g pSvrOptions-»m szHomeDir) + "WV" + szFileName; 
313 f = fopen(szFullPathName.c str(), "r+b"); 

314 if(f != NULL)( 

315 // Retrive file size 

316 fseek(f, 0, SEEK END); 

317 fgetpos(f, &lengthActual); 

318 fseek(f, 0, SEEK SET); 

319 

320 pBuf = new char[lengthActual + 1]; 

321 length = fread(pBuf, 1, lengthActual, f); 

322 fclose(f); 

323 // Make Response 

324 sprintf (pResponseHeader, "HTTP/1.0 %s\r\nDate: %s\r\nServer: %s\r\ 


nAccept-Ranges: bytes\r\nContent-Length: %d\r\nConnection: %s\r\ 
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nContent-Type: %s\r\n\r\n", 
325 szStatusCode.c_str(), szDT, WEBSERVER_NAME, (int) length, 
bKeepAlive ? "Keep-Alive" : "close", szContentType.c str()); 


326 } 

327 else{ 

328 // In case of file not found 

329 szFullPathName = g pSvrOptions-»m szHomeDir + ERROR404; 

330 f = fopen(szFullPathName.c str(), "r*b"); 

331 if(f != NULL)( 

332 // Retrive file size 

333 fseek(f, 0, SEEK END); 

334 fgetpos(f, &lengthActual) ; 

335 fseek(f, 0, SEEK SET); 

336 pBuf = new char[lengthActual + 1]; 

337 length = fread(pBuf, 1, lengthActual, f); 

338 fclose(f); 

339 szNotFoundMessage - string(pBuf, length); 

340 delete [] pBuf; 

341 pBuf = NULL; 

342 i 

343 szStatusCode = "404 Resource not found"; 

344 sprintf (pResponseHeader, "HTTP/1.0 %s\r\nContent-Length: %d\r\ 
nContent-Type: text/html\r\nDate: %s\r\nServer: %s\r\n\r\n%s", 

345 szStatusCode.c_str(), szNotFoundMessage.size(), szDT, WEBSERVER 

_NAME, szNotFoundMessage.c_str()); 

346 bKeepAlive = FALSE; 

347 } 

348 szResponse = string (pResponseHeader) ; 

349 if (pBuf) 

350 szResponse += string(pBuf, length); 

351 delete [] pBuf; 

352 pBuf = NULL; 

353 return TRUE; 

354 } 


355 MIHI MB M HMM M M M M M I I P M P P P nnhnh TT 
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357 LPCONN CTX CHttpServer: :CreateConnCtx (SOCKET sockAccept, HANDLE hIOCP) 
358 ( 

359 LPCONN CTX lpConnCtx = new CONN CTX; 

360 if (lpConnCtx == NULL) 

361 return NULL; 
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362 
363 
364 
365 
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368 
369 


370 
371 
372 
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380 
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386 
387 


388 
389 
390 


391 


392 
393 
394 
395 
396 
397 
398 
399 
400 
401 
402 


// 赋值 

lpConnCctx-»pNext = NULL; 

lpConnCtx-»pPrec = NULL; 
lpConnCtx-»sockAccept = sockAccept; 
lpConnCtx-»szRequest.erase(0, string::npos); 
lpConnCtx-»szResponse.erase(0, string::npos); 
lpConnCtx-»bKeepAlive = FALSE; 
lpConnCtx-»nAlreadyResponsed = 0; 


ZeroMemory (lpConnCtx-»pPerlIOData, sizeof (PER IO DATA)); 
lpConnCtx-»pPerIOData-»OverLapped.hEvent = NULL; 
1pConnCtx->pPerIOData->OverLapped.Internal = 0; 
1pConnCtx->pPerIOData->OverLapped.InternalHigh = 0; 
lpConnCtx-»pPerlIOData-»OverLapped.Offset = 0; 
lpConnCtx-»pPerlIOData-»OverLapped.OffsetHigh = 0; 
lpConnCtx-»pPerlOData-»wbuf.buf = (char *) lpConnCtx->pPerIOData->data; 
lpConnctx-»pPerlOData-»wbuf.len = MAX BUF LEN; 
lpConnctx-»pPerlOData-»oper = SVR IO READ; 

lpConnCtx->pPerIOData->flags = 0; 


// 将 套 接口 与 完成 端口 绑 定 
if (!AssociateWithIoCompletionPort (m_hIOCP， (HANDLE) sockAccept, (DWORD) 
lpConnctx) ) { 
delete lpConnCtx; 
lpConnCtx = NULL; 
return NULL; 


return lpConnCtx; 


void CHttpServer::ConnListAdd (LPCONN CTX lpConnCtx) 


{ 


LPCONN_CTX pTemp; 
EnterCriticalSection(&m CriticalSection); 


if (m_ptrConnCtxHead == NULL) { 
// 链表 的 第 一 个 〈 惟 一 ) 节点 
lpConnCtx->pPrec = NULL; 
lpConnctx-»pNext = NULL; 
m ptrConnCtxHead = lpConnCtx; 
jelse{ 
// 加 到 链表 头 部 
pTemp = m ptrConnCtxHead; 
m_ptrConnCtxHead = lpConnCtx; 
lpConnCtx->pNext = pTemp; 
lpConnCtx->pPrec = NULL; 
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pTemp-»pPrec = lpConnCtx; 


LeaveCriticalSection (&m_CriticalSection) ; 


void CHttpServer: :ConnListRemove (LPCONN CTX lpConnCtx) 


{ 


LPCONN_CTX pPrec; 
LPCONN_CTX pNext; 


EnterCriticalSection (&m_CriticalSection) ; 
if(lpConnctx) { 


pPrec = lpConnCtx->pPrec; 
pNext = lpConnCtx-»pNext; 
if ((pPrec == NULL) && (pNext == NULL))(// [*] -> NULL: 链表 惟一 节点 
m_ptrConnCtxHead = NULL; 
} 
else if((pPrec == NULL) && (pNext != NULL)){// [*] -> [] >.... []: 
链表 首 节点 
pNext-»pPrec = NULL; 
m_ptrConnCtxHead = pNext; 
) 
else if((pPrec != NULL) && (pNext == NULL))(// [ ] -> [] -> .... [*]: 
链表 末节 点 
pPrec->pNext = NULL; 
} 
else if( pPrec && pNext ) (// [ ] -> [*] -> .... [ ]: 链表 中 间 节 点 
pPrec-»pNext = pNext; 
pNext-»pPrec = pPrec; 


// 关闭 连接 ， 释 放 资 源 
if(lpConnCtx->sockAccept != INVALID SOCKET)( 


#ifdef _DEMO 


#endif 


SOCKADDR_IN from; 

memset (&from, 0, sizeof (from) ); 

int fromlen = sizeof (from); 

getpeername (lpConnCtx-»sockAccept, (SOCKADDR *) &from, &fromlen) ; 

AfxGetMainWnd()-»PostMessage (WM USER CLIENT, from.sin addr.s addr, 
CLIENT DISCONNECT); 


closesocket (1pConnCtx-»sockAccept) ; 
) 
delete lpConnCtx; 
lpConnCtx = NULL; 
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466 
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486 


LeaveCriticalSection(&m CriticalSection); 
return; 


void CHttpServer: :ConnListClear () 


{ 


} 


LPCONN CTX pTempl, pTemp2; 


EnterCriticalSection (&m_CriticalSection) ; 
pTempl = m_ptrConnCtxHead; 
while(pTempl) { 
pTemp2 = pTempl-»pNext; 
ConnListRemove (pTemp1) ; 
pTempl = pTemp2; 
} 
LeaveCriticalSection(&m CriticalSection); 
return; 
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// 服务 器 管理 线程 
DWORD WINAPI CHttpServer::AdminThread(LPVOID pParam) 


t 


CHttpServer *pHttpServer = (CHttpServer *) pParam; 
// 通知 StartServer 函数 ，Rdmin 线程 已 启动 
SetEvent (pHttpServer-»m evtThreadLanched); 
// 等 待 服务 停止 指令 ， 该 指令 在 三 种 情况 下 会 被 触发 : 
// 1. 调用 StartServer 函数 时 ，ListenThread 未 能 正常 启动 
// 2. 服务 器 ListenThread 运行 过 程 中 出 错 
// 3. 调用 StopServer 函数 
WaitForSingleObject (pHttpServer-»m evtSvrToStop, INFINITE); 
// Do Clear Work 
if (pHttpServer->m_sdListen != INVALID SOCKET) 
closesocket (pHttpServer-»m sdListen);// 将 导致 ListenThread 的 accept 
调用 出 错 并 结束 
if(pHttpServer-»m hIOCP) {// 通知 Service 线程 结束 
for(UINT i = 0; i < pHttpServer-»m nSvcThreadNum; i++) 
PostQueuedCompletionStatus (pHttpServer-»m hIOCP, 0, 0, NULL); 
} 
// 等 待 所 有 Service 线程 和 监听 线程 结束 
WaitForMultipleObjects (pHttpServer-»m nSvcThreadNum + 1, 
&(pHttpServer-»m hThreadList[1]), 
TRUE, 
WAIT4THREAD MILLISECS * 2); 


DWORD nExitCode; 
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487 for(UINT j = 1; j < pHttpServer->m nSvcThreadNum + 1; j++){ 
488 GetExitCodeThread (pHttpServer->m hThreadList[j], &nExitCode) ; 
489 if(nExitCode — STILL ACTIVE) 

490 TerminateThread (pHttpServer-»m hThreadList[j], 1); 

491 } 

492 pHttpServer->ResetAl1 (); 

493 return 0; 

494 } 


495 // 服务 器 监听 线程 

496 DWORD WINAPI CHttpServer: :ListenThread (LPVOID pParam) 
497 { 

498 CHttpServer *pHttpServer = (CHttpServer *) pParam; 


499 // 创建 I/o 完成 端口 


500 pHttpServer-»m hIOCP = CreateNewloCompletionPort (0) ; 
501 if (pHttpServer->m_hIOCP == NULL) 
502 return -1; 


503 // 创建 多 个 工作 线程 


504 for(UINT i = 0; i < pHttpServer->m nSvcThreadNum; i++) { 
505 HANDLE hThread = CreateThread(NULL, 0, ServiceThread, pHttpServer, 
0, NULL); 

506 if (hThread == NULL) 

507 return -1; 

508 else 

509 pHttpServer-»m hThreadList[i + 2] = hThread; 

510 y 

SLL 

512 pHttpServer-»m sdListen = socket(AF INET, SOCK STREAM, 0); 

513 if(pHttpServer-»m sdListen == INVALID SOCKET) 

514 return -1; 

515 

516 BOOL bReuseAddr = TRUE; 

517 if(setsockopt(pHttpServer-»m sdListen, SOL SOCKET, SO REUSEADDR, (char *) 
&bReuseAddr, sizeof(bReuseAddr)) 一 SOCKET ERROR) 

518 return -1; 

519 SOCKADDR IN local; 

520 memset (&local, 0, sizeof(local)); 

521 local.sin family = AF INET; 

522 local.sin port = htons(g pSvrOptions-»m nServerPort); 

523 local.sin addr.S un.S addr = INADDR ANY; 

524 if(bind(pHttpServer-»m sdListen, (SOCKADDR *) &local, sizeof(local)) == 


SOCKET ERROR) 
525 return -1; 
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if (listen (pHttpServer->m sdListen, 5) == SOCKET ERROR) 
return -1; 
// 通知 StartServer 函数 ， 监 听 线程 已 启动 
SetEvent (pHttpServer-»m evtThreadLanched); 
SOCKET sockAccept; 
LPCONN CTX lpConnCtx; 
int nResult; 
#ifdef DEMO 
SOCKADDR IN from; 
#endif 
while (1) { 
sockAccept = accept (pHttpServer->m_sdListen, NULL, NULL); 
if(sockAccept == INVALID SOCKET)( 
SetEvent (pHttpServer-»m evtSvrToStop); 
return -1; 
) 
#ifdef DEMO 
memset(&from, 0, sizeof(from)); 
int fromlen = sizeof (from); 
getpeername(sockAccept, (SOCKADDR *) &from, &fromlen) ; 
AfxGetMainWnd () ->PostMessage (WM_USER_CLIENT, from.sin addr.s addr, 
CLIENT CONN REQ); 
#endif 
if (pHttpServer—>m_bSvrPaused) { 
closesocket (sockAccept) ; 
#ifdef DEMO 
AfxGetMainWnd ()->PostMessage (WM_USER_CLIENT, from.sin_addr.s_ 
addr, CLIENT REJECT) ; 
#endif 
continue; 
} 
lpConnctx = pHttpServer-»CreateConnCtx (sockAccept, pHttpServer-> 
m hIOCP); 
if (lpConnCtx == NULL) { 
SetEvent (pHttpServer-»m evtSvrToStop); 
return -1; 
) 
else 
pHttpServer-»ConnListAdd (lpConnCtx) ; 
#ifdef DEMO 


AfxGetMainWnd()-»PostMessage(WM USER CLIENT, from.sin addr.s addr, 
CLIENT ACCEPT); 
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565 #endif 

566 

567 // 投递 初始 I/0 操作 

568 nResult = WSARecv (sockAccept, 

569 & (lpConnCtx->pPerIOData->wbuf), 

570 1, 

571 NULL, 

572 &(1pConnctx-»pPerlIOData-^flags), 

573 & (TpConnctx-»pPerIOData-»OverLapped), 

574 NULL); 

575 if((nResult == SOCKET ERROR) && (WSAGetLastError() != ERROR IO - 
PENDING) ) ( 

576 pHttpServer-»ConnListRemove (lpConnCtx); 

577 continue; 

578 } 

579 } 

580 return 0; 

581 } 

582 // 服务 线程 

583 DWORD WINAPI CHttpServer::ServiceThread(LPVOID pParam) 

584 ( 

585 CHttpServer *pHttpServer = (CHttpServer *) pParam; 

586 HANDLE hIOCP = pHttpServer->m_hIOCP; 

587 

588 BOOL bSuccess - false; 

589 DWORD dwIOSize; 

590 LPPER IO DATA lpPerlIOData; 

591 LPOVERLAPPED pOverLapped; 

592 LPCONN CTX lpConnCtx; 

593 int nResult; 

594 while(1)( 

595 bSuccess = GetQueuedCompletionStatus (hIOCP, &dwlIOSize, (LPDWORD) 
&lpConnCtx, &pOverLapped, INFINITE); 

596 if(lpConnctx == NULL) 

597 return -1; 

598 lpPerIOData = (LPPER IO DATA) (pOverLapped) ; 

599 if(!bSuccess || (bSuccess && (dwIOSize == 0))){ 

600 pHttpServer-»ConnListRemove (lpConnCtx); 

601 continue; 

602 ] 

603 switch (1pPerIOData-^»oper)( 

604 case SVR IO WRITE:// 上 一 次 操作 是 Response - WSASend 


605 lpConnctx-»nAlreadyResponsed =+ dwlIOSize; 
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606 if (1pConnCtx->nAlreadyResponsed 一 lpConnCtx-»szResponse.size()) 
{// Response 完毕 

607 if(!1pConnctx-»bKeepalive) (// 不 需要 保持 连接 

608 pHttpServer—>ConnListRemove (lpConnCtx); 

609 continue; 

610 } 

611 else(// 需要 保持 连接 ， 接 收 新 的 Request 

612 ZeroMemory (lpPerIOData, sizeof (PER IO DATA)); 

613 lpPerlIOData-»wbuf.buf = (char *) &(lpPerIOData-»data); 

614 lpPerlOData-»wbuf.len = MAX BUF LEN; 

615 lpPerlOData-»oper = SVR IO READ; 

616 lpPerlIOData-^flags = 0; 

617 

618 lpConnCtx-»szResponse.erase(0, string::npos); 

619 lpConnCtx-»nAlreadyResponsed = 0; 

620 

621 nResult = WSARecv (lpConnCtx->sockAccept, 

22 & (1pPerIOData-»wbuf), 

623 a, 

624 NULL, 

625 &(1pPerlIOData-^flags), 

626 & (lpPerIOData->OverLapped) , 

627 NULL); 

628 if (nResult == SOCKET ERROR && WSAGetLastError() !— ERROR 

IO PENDING)( 

629 pHttpServer-»ConnListRemove (lpConnCtx); 

630 } 

631 } 

632 } 

633 else{// 继续 发 送 Response 

634 lpPerlOData-»oper = SVR IO WRITE; 

635 lpPerlOData-»wbuf.buf = (char *) (lpConnCtx->szResponse.c 
_str() + lpConnCtx->nAlreadyResponsed) ; 

636 lpPerlOData-»wbuf.len = lpConnCtx->szResponse.size() - 
lpConnCtx->nAlreadyResponsed; 

637 lpPerIOData->flags = 0; 

638 nResult = WSASend (lpConnCtx->sockAccept, 

639 &(1pPerlIOData-^wbuf), 

640 i, 

641 NULL, 

642 lpPerlOData-^flags, 

643 & (1pPerIOData-^OverLapped), 

644 NULL); 

645 if(nResult 一 SOCKET ERROR && WSAGetLastError() != ERROR IO 
. PENDING) ( 

646 pHttpServer—>ConnListRemove (lpConnCtx); 

647 } 
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break; 
case SVR IO READ: // 上 一 次 操作 是 接收 Request - WSARecv 
lpConnCtx->szRequest += string (lpPerIOData->data, dwIOSize); 
if (lpConnCtx->szRequest.size() > MAX HTTP REQUEST LEN)( 
pHttpServer-»ConnListRemove (1pConnCtx) 7 
continue; 
} 
if (pHttpServer—>IsRequestCompleted (lpConnCtx->szRequest) ) { 
// 已 经 得 到 完整 的 Request， 作 出 Response 
pHttpServer->ProcessRequest (lpConnCtx-»szRequest, 
lpConnCtx-»szResponse, 
lpConncCtx-»bKeepAlive); 
lpConnCtx-»szRequest.erase(0, string::npos); 
lpPerIOData->oper = SVR IO WRITE; 
lpPerlOData-»wbuf.buf = (char *) lpConnCtx-> 
szResponse.c str(); 
lpPerlOData-»wbuf.len = lpConnCtx->szResponse.size(); 
lpPerlOData-»flags = 0; 
nResult = WSASend (1pConnCtx-»sockAccept, 
& (lpPerIOData->whbuf) , 
1, 
NULL, 
lpPerlOData-»flags, 
& (lpPerIOData->OverLapped) , 
NULL); 
if(nResult — SOCKET ERROR && WSAGetLastError() != ERROR IO 
. PENDING) { 
pHttpServer-»ConnListRemove (lpConnCtx); 


) 

else(// 否则 继续 read Request 
ZeroMemory (lpPerlOData, sizeof(PER IO DATA)); 
lpPerlOData-»oper = SVR IO READ; 
lpPerlOData-»wbuf.buf = (char *) &(lpPerIOData—>data) ; 
lpPerlOData-»wbuf.len = MAX BUF LEN; 
lpPerIOData->flags = 0; 


nResult = WSARecv (lpConnCtx->sockAccept, 
& (1pPerIOData-»wbuf), 
1, 
NULL, 
&(1pPerlIOData-^flags), 
& (1pPerIOData-»OverLapped), 
NULL); 

if(nResult == SOCKET ERROR && WSAGetLastError() != ERROR IO 

. PENDING) { 
pHttpServer—>ConnListRemove (1pConnCtx) ; 
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return 0; 


} 


CAAA 


第 12 一 16 行使 用 #define 3E X. T. CreateNewIoCompletionPort, Associate WithIoCompletion- 
Port 两 个 宏 定义 函数 ， 分 别 用 于 创建 IO 完成 端口 和 绑 定 完成 端口 。 
第 19—31 行 CHttpServer 构造 函数 。 


口 
a 
a 
a 
a 


第 


21 一 22 行 ， 创 建 事件 对 象 m_evtThreadLanched、m_evtSvrToStop， 这 两 个 事件 对 象 
均 为 Auto-Reset 类 型 ， 并 且 初 始 状态 为 未 触发 。 
23 行 ， 初 始 化 临界 区 对 象 m_CriticalSection 。 
24 行 ， 调 用 ResetAll 成 员 函 数 ， 复 位 内 部 变量 。 
25 一 28 行 ,获取 系统 的 CPU 处 理 器 数目 ,将 处 理 器 数目 X2 与 MAX SERVICETHREAD 
_NUM 之 间 的 较 小 值 赋 给 成 员 变量 m_nSvcThreadNum。 
30 行 ， 调 用 InitMimeTypes 成 员 函 数 ， 初 始 化 m_MimeTypes 值 ， 建 立 文件 后 级 名 
与 MIME 资源 类 型 之 间 的 映射 关系 。 参 见 代 码 132—206 行 。 
32~37 行 CHttpServer 析 构 函数 。 关 闭 事 件 对 象 句柄 m_evtThreadLanched 和 


m_evtSvrToStop， 并 且 删 除 临界 区 对 象 m_CriticalSection。 
第 38 一 100 行 StartServer，public 成 员 函 数 ， 启 动 MyWeb 服务 。 


口 


40~47 行 ， 判 断 服务 器 当前 状态 ， 如 果 已 处 于 运行 态 ， 则 函数 直接 返回 FALSE; 

如 果 本 来 处 于 暂停 状态 ， 那 么 将 m_bSvrPaused 设置 为 FALSE, Jf H E Bede 
m ServerState 设置 为 SERVER_RUNNING， 函 数 返 回 TRUE; 否则， 进入 下 一 步 。 
48 一 52 行 ， 初 始 化 Winsock， 并 复位 服务 器 。 

53 一 68 行 ， 启 动 管理 线程 。 首 先 在 54 一 59 行 创建 管理 线程 ， 然 后 主线 程 在 60—67 
行 等 待 管理 线程 触发 m_evtThreadLanched 事件 对 象 。 如 果 在 WAIT4THREAD 
_MILLISECS 时 间 内 该 事件 对 象 被 触发 ， 说 明 管 理 线程 已 正常 启动 ， 否 则 该 线程 未 
正常 启动 ， 进 行 一 定 的 清理 工作 后 ， 函 数 退 出 并 返回 FALSE。 在 68 行 ， 将 确定 已 
正常 启动 的 管理 线程 句柄 保存 至 m_hThreadList[0]。 

70—97 行 ， 启 动 监听 线程 。 在 71 行 ， 复 位 事件 对 象 m_evtThreadLanched。 在 72 
行 ， 创 建 监听 线程 ， 根 据 返 回 值 分 两 种 情况 处 理 : @ 如 果 创 建 线程 失败 ， 那 么 触 
发 m_evtSvrToStop 事件 (75 行 )， 通 知已 处 于 运行 中 的 管理 线程 终止 服务 ， 然 后 等 
待 管理 线程 结束 (77 行 )， 如 果 在 WAITATHREAD MILLISECS*3 时 间 内 管理 线程 
未 正常 结束 ， 那 么 调用 TerminateThread 函数 将 其 强行 终止 (78 行 )。 在 结束 了 管理 
线程 之 后 ， 关 闭 其 句柄 ， 作 清理 工作 后 函数 退出 并 返回 FALSE. © 线程 创建 成 功 ， 
那么 等 待 监听 线程 触发 m evtThreadLanched 事件 (85 行 )。 如 果 在 


口 
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WAITATHREAD MILLISECS 时 间 内 该 事件 对 象 未 被 触发 ， 说 明 监听 线程 未 能 正常 
启动 ， 和 Case I HEITER LH: 通知 管理 线程 终止 服务 ， 进 行 相关 清理 工作 后 函 
数 退 出 并 返回 FALSE. 97 行 ， 将 已 正常 启动 的 监听 线程 句柄 保存 至 
m hThreadList[1]。 

98~99 行 ， 更 改 服务 器 状态 值 m_ServerState 为 SERVER. RUNNING， 函 数 正常 返 
回 TRUE。 


第 101 一 108 行 PauseServer，public 成 员 函 数 ， 暂 停 服 务 器 。 该 函数 所 做 工作 非常 简单 ， 
只 需要 将 m_bSvrPaused 成 员 变 量 赋值 为 TRUE， 并 将 服务 器 状态 置 为 SERVER. PAUSE. 
第 109—125 fT StopServer，public MAMA, (ILA. 


口 


goog 


a 


111—112 行 ， 如 果 服 务 器 本 来 就 处 于 SERVER. STOP 状态 ， 函 数 直接 返回 FALSE, 
否则 执行 下 一 步 。 

113 行 ， 触 发 事件 对 象 m_evtSvrToStop， 通 知 管理 线程 终止 服务 器 。 

115 行 ， 等 待 管理 线程 结束 ， 时 限 为 WAITATHREAD MILLISECS * 3. 

116—119 行 ， 检 查 管理 线程 状态 ， 如 果 该 线程 仍 处 于 运行 态 ， 则 将 其 强行 终止 。 
121 一 122 行 ， 调 用 ResetAll 函数 复位 内 部 变量 ， 调 用 WSACleanup 结束 Winsock 
的 使 用 。 

123 行 ， 函 数 返回 TRUE。 


第 126—129 行 GetServerState, public 成 员 函 数 ， 返 回 服务 器 的 当前 状态 m_ServerState. 

第 132 一 206 行 mitMimeTypes，protected 成 员 函 数 ， 给 m_MimeTypes 成 员 变量 赋值 ， 
建立 文件 后 缀 名 与 MIME 资源 类 型 之 间 的 映射 关系 。 

第 207—226 行 ResetAll，protected 成 员 函 数 ， 复 位 内 部 变量 。 


a 


DOOODODO 


209—210 行 ， 将 服务 器 状态 值 m_ServerState 置 为 SERVER_STOP， 将 监听 套 接 口 
m sdListen Jy INVALID SOCKET. 

211 一 215 行 ,关闭 运行 线程 句柄 数组 m_hThreadList 中 的 非 空 句柄 , 并 赋值 为 NULL。 
216—219 行 ， 如 果 完 成 端口 句柄 m_hIOCP 值 非 空 ， 将 其 关闭 ， 并 置 为 NULL。 
220~221 行 ， 调 用 ConnListClear 成 员 函 数 清除 连接 信息 链表 m_ptrConnCtxHead. 
222—223 行 ， 复 位 事件 对 象 m_evtThreadLanched 和 m_evtSvrToStop. 

224—225 fT, Tf m bSvrPaused H Jy FALSE, m ptrConnCtxHead #9 NULL. 


第 229—238 {TF IsRequestCompleted, protected 成 员 函 数 , 用 于 判断 HTTP 请 求 是 否 已 完 
整 。 如 果 请 求 信息 szRequest 中 包含 字符 串 “nm”， 则 认为 该 HTTP 请 求 已 完整 ， 返 回 
TRUE， 否 则 返回 FALSE. 

第 239—354 行 ProcessRequest，protected 成 员 函 数 。 需 要 注意 的 是 该 函数 的 3 个 输入 参 
数 : 第 一 个 参数 是 szRequest， 用 于 传 入 HTTP 请 求 字 符 串 ; 后 两 个 分 别 是 szResponse 和 
bKeepAlive 的 引用 ， 用 于 保存 szRequest 的 处 理 结果 。 

在 分 析 这 一 段 代 码 之 前 ， 首 先 简单 介绍 HTTP 协议 的 相关 知识 ， 有 兴趣 的 读者 可 以 查阅 
RFC 1945. Hypertext Transfer Protocol -- HTTP/1.0 和 RFC 2068. Hypertext Transfer Protocol -- 
HTTP/1.1. 

HTTP 协议 的 执行 采用 标准 的 C/S 模式 , 客户 端 (通常 是 浏览 器 ) 发 送 用 户 请求 Request， 
服务 器 端 解析 Request 并 返回 Response。 其 中 Request 的 定义 如 下 : 
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Request = Request-Line 
*(General-Header | Request-Header| Entity-Header) 
<CRLF> 
[Message-Body] 

Request-Line = Method<SP>Request-URI<SP>HTTP-Version<CRLF> 


Method = "GET" | "HEAD"| "POST" | extension-method 
Method = "OPTIONS" | "GET" | "HEAD" | "POST" | "PUT" 
| "DELETE" | "TRACE" | extension-method 


extension-method - token 
其 中 <SP> 表 示 空 格 ，<CRLEF> 是 回 车 换行 。 由 上 述 定义 可 以 总 结 出 HTTP 请 求 的 基本 格 
式 是 : 


Method<SP> Request-URI<SP>**** 
Web 服务 器 在 完成 对 Request 解析 和 处 理 之 后 ， 返 回 Response，Response 的 定义 如 下 : 


Response = Status-Line 
* (General-Header | Response-Header | Entity-Header) 
<CRLE> 
[Message-Body] 
Status-Line = HTTP-Version<SP>Status-Code<SP>Reason-Phrase<CRLF> 
Status-Code = "200" ; OK 
"201" ; Created 
"202"  ; Accepted 
"204"  ; No Content 
"301" ; Moved Permanently 
"302"  ; Moved Temporarily 
"304"  ; Not Modified 
"400"  ; Bad Request 
"401"  ; Unauthorized 
"403"  ; Forbidden 
"404"  ; Not Found 
"500" ; Internal Server Error 
"501" ; Not Implemented 
"502"  ; Bad Gateway 
"503"  ; Service Unavailable 


| extension-code 


我 们 对 HTTP 请 求 和 响应 的 基本 格式 已 经 有 一 定 的 了 解 ， 下 面 对 ProcessRequest 成 员 函 


数 进行 分 析 : 
O 255—286 íF, MENT szRequest 请 求 字 符 串 中 所 含 的 Method， 并 读 取 所 请 求 资源 的 
URI。 


+ 根据 上 面 对 HITP-Request 的 分 析 可 以 知道 ， 所 有 请 求 串 都 以 “Method<SP> 
RequestURI<SP>……?” 的 形式 存在 ， 因 此 在 256 行 ， 首 先 获取 szRequest 串 中 空格 
所 在 的 位 置 (变量 n): WF n 等 于 常量 string::npos, 说 明 szRequest 中 不 存在 空格 ， 
那么 该 HTTP 请 求 是 无 法 识别 的 ， 将 szFileName 设置 为 501 错误 页 面 ERROR501 


+00 
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(283—286 47); 否则 ，szRequest 中 前 n 个 字符 即 组 成 HTTP-Request 中 的 Method 

(变量 szMethod). 

由 于 MyWeb 目前 只 支持 "GET" Method， 如 果 请 求 的 Method 不 是 "GET"， 那 么 在 
278—281 行将 szFileName 设置 为 501 错误 页 面 ERRORSOI; 和 否则， 进行 下 一 步 对 
Request-URI 的 解析 。 
在 261 fT, 在 去 除 Method<SP> 后 剩 下 的 HTTP 请 求 串 中 查找 空格 〈 变 量 nl1 )， 如 果 
nl 等 于 string::npos, 说 明 Request-URI 无 法 解析 , 将 szFileName 设置 为 501 错误 页 
面 ERROR501 (273—276 行 ); 否则 szRequest 从 第 n*1 个 字符 开始 的 nl-n-1l 个 字 
符 组 成 Request-URI (变量 szFileName )。 
在 263—269 行 ， 对 szFileName 作 了 简单 的 安全 检查 ， 以 防止 客户 端 请 求 的 资源 超 
出 允许 的 目录 范围 : 如 果 szFileName 包含 ".."，szFileName 设置 为 404 错误 页 面 
ERROR404。 需 要 指出 的 是 ， 这 种 检查 是 必需 的 ， 但 并 不 完备 。 
在 270—271 行 , 如 果 szFileName 等 于 "/", 那么 将 MyWeb 默认 页 面 Cg. pSvrOptions 
->m_szDefaultPage) 的 地 址 值 赋 给 szFileName。 
287—292 行 ， 确 定 是 否 要 保存 连接 存活 。 在 szRequest 请 求 串 中 查找 “Connection: 
Keep-Alive”， 如 果 存 在 则 认为 需要 保持 连接 ， 将 bKeepAlive 设置 为 TRUE; 否则 
bKeepAlive 为 FALSE。 
293—302 行 ， 确 定 响应 数据 的 资源 类 型 。 在 294 一 297 行 ， 首 先 获取 szFileName 的 
JGR szFileExt; 然后 在 298—301 行 ， 从 m MimeTypes 对 应 表 中 查找 szFileExt 
对 应 的 MIME 资源 类 型 (变量 szContentType). 
303—309 行 ， 获 取 当 前 GMT 格式 的 日 期 、 时 间 (变量 szDT)。 
310—353 行 ， 组 装 HTTP-Response (变量 szResponse ). 
311—313 行 ， 根据 MyWeb 服务 器 的 根 目录 路 径 〈(g_pSvrOptions->m_szHomeDir) 
和 文件 名 (szFileName) 组 装 被 请 求 资源 的 完整 路 径 szFullPathName， 并 打开 文件 。 
314—326 行 ， 如 果 szFullPathName 对 应 文件 存在 ， 那 么 将 文件 数据 读 取 至 pBuf， 
并 按 HTTP/1.0 规范 组 装 pResponseHeader。 然 后 在 348 一 352 行 ， 将 pBuf 数据 附 在 
pResponseHeader 之 后 组 成 szResponse。 
327~353 行 ， 如 果 szFullPathName 对 应 文件 不 存在 ， 那 么 选择 打开 404 错误 页 面 
ERROR404， 即 \E404.html， 同 样 读 取 文件 内 容 (变量 szNotFoundMessage )。 无 论 
ERROR404 文件 是 否 存 在 ， 都 按 HTTP/1.0 规范 组 装 pResponseHeader， 并 将 
bKeepAlive 设 定 为 FALSE。 最 后 在 348—352 行 直接 将 pResponseHeader 的 值 赋 给 
szResponse。 
357—387 行 ，CreateConnCtx，protected 成 员 函 数 。 如 前 所 述 ， 主 要 完成 两 个 工作 : 
一 是 将 套 接口 sockAccept 与 完成 端口 HOCP 绑 定 ， 二 是 为 新 到 来 的 客户 端 连接 创 
建 CONN_CTX 数据 。 从 359 一 379 行 ， 创 建 CONN CTX 类 对 象 pConnCtx 并 赋 初 
值 ， 从 380—385 行 ， 将 sockAccept 与 HOCP 绑 定 。 在 上 述 过 程 中 ， 如 果 有 错误 发 
Æ, BE NULL, FURE pConnCtx。 
388—406 fT, ConnListAdd, protected 成 员 函 数 ， 将 连接 信息 IpConnCtx 加 入 到 
CHttpServer 模块 维持 的 全 局 连接 链表 。 属于 普通 的 双向 链表 操作 , 惟一 需要 注意 的 
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是 ， 由 于 可 能 有 多 个 线程 同时 对 该 双向 链表 进行 操作 ， 
m CriticalSection 临界 区 变量 来 进行 线程 的 互 斥 管理 。 

C) 407—447 ff, ConnListRemove, protected 成 员 函 数 ， 将 连接 信息 IpConnCtx 从 
CHttpServer 模块 维持 的 全 局 连接 链表 中 删除 ， 该 函数 一 般 在 连接 结束 的 时 候 调用 。 
与 上 面 的 ConnListAdd 成 员 函 数 一 样 ，ConnListRemove 完成 基本 的 双向 链表 操作 ， 
并 且 实 现 了 线程 之 间 互 斥 的 资源 访问 管理 。 下 面 着 重 介 绍 432 一 438 行 代码 。 

O “432 行 ， 使 用 条 件 编译 ， 如 果 在 项 目 中 定义 了 _DEMO， 那 么 执行 433 一 437 行 的 代 
码 , 否则 直接 跳 过 。 在 本 项 目的 Preprocessor Definitions 中 加 入 了 _DEMO, 如 图 22.7 
所 示 。 


该 函数 使 用 了 


Settings For: [Win32 Release | 
© C3 Source Files 
E HttpServer.cpp. 
15) MyNotitylcon.cpp. 
15) MyWebServer.cpp 
15) MyWebServer.rc 


3) Options.cpp 
3) OptSetupDlg.cpp. 
2 pp. 


& C3 Header Files 
© CJ Resource Files 
国 ReadMe.bd. 


General | Debug C/C++ | Link | Resources | "m 


Category: |General x Reset 


Warning level: Optimizations: 
[Leve 3 c] [Maximize Speed z] 


T^ Warnings as errors 厂 Generate browse info 


Debug info: 


Preprocessor definitions: 


[WIN3Z,NDEBUG, WINDOWS, AFKDLL, MBCS| DEMO| 


Project Options: 
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O 433—436 行 ,调用 getpeername 函数 获取 IpConnCtx 对 应 的 连接 的 客户 端的 下 地 址 。 
O 437 行 ， 向 主 窗 体 发 送 消息 WM_USER_CLIENT， 两 个 参数 分 别 是 客户 端 地 址 
from.sin_addr.s_addr 和 自 定义 客户 消息 类 型 CLIENT_DISCONNECT。 
O 438 行 ， 结 束 DEMO 条 件 编译 。 
O 448~460 行 ，ConnListClear，protected 成 员 函 数 ， 调 用 ConnListRemove 成 员 函 数 
关闭 当前 的 所 有 连接 并 清除 连接 信息 链表 。 
O 463~700 行 ，CHttpServer 类 的 3 个 静态 成 员 函 数 : AdminThread、ListenThread 和 
ServiceThread， 分 别 是 服务 器 的 管理 线程 函数 、 监 听 线 程 函数 和 服务 线程 函数 。 
事实 上 ， 在 整个 MyWeb 服务 器 系统 包含 了 4 类 线程 ， 除 了 上 述 3 种 线程 外 ， 还 包括 系 
统 的 主线 程 ， 对 应 于 用 户 GUI 界面 。 在 主线 程 中 ， 创 建 了 CHttpServer 类 的 一 个 实例 ， 用 户 
通过 单 击 某 些 菜单 可 以 调用 该 实例 的 StartServer/PauseServer/StopServer 等 public 成 员 函 数 。 
图 22.8 展现 了 这 4 类 线程 之 间 的 同步 关系 ， 虚 线 箭头 表示 启动 (调用 ) 和 人 触发， 下面 对 这 些 
线程 之 间 的 关系 进行 详细 分 析 。 
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l. 从 用 户 操作 的 角度 来 分 析 线程 之 间 的 调用 和 相互 触发 关系 
a) 启动 服务 器 
CHttpServer 类 的 成 员 函 数 StartServer 在 主线 程 中 被 调用 ， 该 函数 首先 启动 管理 线程 
AdminThread ， 然 后 等 待 AdminThread 触发 事件 m evtThreadLanched 。 如 果 
m evtThreadLanched 在 一 定时 间 内 被 触发 ， 那 么 说 明 AdminThread 已 正常 启动 ，StartServer 
进入 下 一 步 ， 否 则 StartServer 函数 退出 。 
随后 ，StartServer 启动 监听 线程 ListenThread ， 同 样 等 待 ListenThread 触发 
m_evtThreadLanched. 如 果 m_evtThreadLanched 在 一 定时 间 内 被 触发 , 那么 说 明 ListenThread 
已 正常 启动 ，StartServer 函数 结束 ; 否则 说 明 ListenThread 未 正常 启动 ，StartServer 将 触发 
m_evtSvrToStop， 通 知 管理 线程 结束 服务 器 。 正 常情 况 下 ， 管 理 线程 在 结束 监听 线程 和 服务 
线程 后 会 自动 结束 ， 但 是 某 些 情况 下 ， 如 果 管 理 线程 未 能 正常 结束 ， 那 么 StartServer 会 在 退 
出 之 前 强制 关闭 管理 线程 。 
(2) 停止 服务 器 
StopServer 函数 也 在 主线 程 中 被 调用 , 该 函数 触发 m_evtSvrToStop 事件 通知 管理 线程 结 
束 服 务 器 。 如 果 管 理 线程 在 一 定时 间 内 自动 结束 ，StopServer 退出 ;否则 强制 结束 管理 线程 
后 再 退出 。 
2. 从 线程 的 启动 和 结束 角度 分 析 线程 之 间 的 同步 
(1) 管理 线程 
管理 线程 AdminThread 由 主线 程 调用 StartServer 函数 启动 。 在 启动 之 后 ，AdminThread 
立即 触发 m_evtThreadLanched 事件 通知 StartServer 本 线程 已 启动 ， 随 后 线程 阻塞 在 对 
m_evtSvrToStop 事件 的 等 待 上 。 
在 3 种 情况 下 ，m_evtSvrToStop 事件 会 被 触发 : 
© 调用 StartServer 函数 时 ，ListenThread 未 能 正常 启动 。 
@) ListenThread 运行 过 程 中 accept 出 错 。 
@ 调用 StopServer 函数 ， 停 止 服务 器 。 
在 m_evtSvrToStop 事件 被 触发 后 ， 管 理 线程 采用 两 种 手段 关闭 其 他 线程 
O 关闭 服务 器 监听 套 接 口 ， 使 得 ListenThread 的 accept 调用 出 错 ， 从 而 退出 。 
Q 投递 与 系统 中 服务 线程 数目 相等 的 特殊 完成 信息 包 ， 通 知 ServiceThread 退出 。 
随后 ， 管 理 线程 检测 监听 线程 和 服务 线程 在 一 段 时 间 后 是 否 已 正常 结束 ， 如 果 没 有 结束 
则 强制 关闭 。 完 成 所 有 这 些 工 作 后 ， 管 理 线程 结束 。 
(2) 监听 线程 
监听 线程 ListenThread 由 主线 程 调用 StartServer 函数 而 启动 。 在 被 启动 之 前 ， 
AdminThread 已 成 功 启动 。 
ListenThread 首先 启动 若干 个 ServiceThread， 然 后 进行 一 些 监 听 服 务 的 前 期 准备 工作 。 
在 这 个 过 程 中 ， 如 果 有 错误 发 生 ， 那 么 ListenThread 直接 终止 ， 从 而 导致 StartServer 等 待 
m evtThreadLanched 超时 ; 如 果 没 有 错误 发 生 ， 则 触发 m evtThreadLanched 事件 通知 
StartServer 本 线程 已 成 功 启动 。 接 下 来 的 是 一 个 服务 循环 : ListenThread 调用 accept 函数 接受 
外 来 的 连接 请 求 ， 并 投递 初始 的 IO 操作 。 如 果 在 accept 时 出 错 ， 认 为 或 者 是 发 生 了 严重 的 
软件 故障 ， 或 者 是 AdminThread 通知 ListenThread 结束 服务 。 无 论 具体 是 哪 一 种 情况 ， 
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ListenThread 都 触发 m_evtSvrToStop 事件 ， 然 后 终止 线程 。 
(3) 服务 线程 

服务 线程 ServiceThread 由 监听 线程 启动 ， 用 于 处 理 Vo 数据 ， 包 括 读 取 、 分 析 客户 端的 Gar) 
HTTP-Request， 并 给 出 Response 。 在 系统 中 会 有 多 个 ServiceThread 同时 工作 ， 每 个 
ServiceThread 都 处 于 一 个 循环 中 : GetQueuedCompletionStatus 一 投递 读 / 写 操作 请 求 一 
GetQueuedCompletionStatus…… 。 只 有 在 GetQueuedCompletionStatus 获取 到 特殊 的 完成 信息 

(完成 键 为 NULL， 只 可 能 由 管理 线程 发 送 ) 时 ， 服 务 线程 才 终 止 服务 。 

下 面 对 管理 线程 、 监 听 线 程 和 服务 线程 的 代码 进行 分 析 : 

C) 463~494 行 ，AdminThread， 管 理 线程 函数 。 

+ 466 行 ， 获取 CHttpServer 类 实例 的 指针 。 在 介绍 HttpServerh 文件 时 提 到 过 
AdminThread 是 CHttpServer 类 的 静态 成 员 函 数 , 因此 没有 this 指针 , 也 就 无 法 调用 
类 的 非 静态 成 员 函 数 。 这 里 提供 了 一 个 方法 来 解决 这 个 问题 : 在 StartServer 启动 
AdminThread 线程 时 ,将 this 指针 作为 线程 函数 的 参数 pParam 传递 给 AdminThread, 
在 AdminThread 中 将 pParam 强制 转化 为 CHttpServer 类 指针 后 ， 即 可 读 取 / 调 用 类 
的 成 员 变 量 和 函数 。 此 方法 同样 被 应 用 于 监听 线程 ListenThread 。 

467 一 468 行 ,触发 m_evtThreadLanched 事件 对 象 ,通知 StartServer 函数 AdminThread 

已 启动 。 

473 行 ， 阻 塞 至 m_evtSvrToStop 事件 对 象 被 触发 。 

475 一 476 行 ， 关 闭 服务 器 监听 套 接口 。 

477~480 行 ， 投 递 m_nSvcThreadNum 个 特殊 完成 信息 包 ， 通 知 服务 线程 终止 。 

481 一 485 行 ， 等 待 监听 线程 和 所 有 服务 线程 结束 ， 等待 时 间 为 

WAIT4THREAD MILLISECS * 2. 

+ 486—491 行 ,检查 监听 线程 和 所 有 服务 线程 的 状态 ， 如 果 仍 然 处 于 运行 中 ， 则 将 其 
强行 终止 。 

今 “492 一 493 行 ， 调 用 ResetAll 成 员 函 数 ， 确 保 所 有 变量 均 被 复位 ， 所 有 事件 对 象 都 处 

于 未 触发 状态 。 

O 495~581 行 ，ListenThread， 监 听 线 程 函 数 。 
今 “498 行 ， 获 取 CHttpServer 类 实例 的 指针 。 
+ 499—502 行 ， 创 建 完成 端口 。 如 果 创 建 失败 ，ListenThread 直接 退出 ， 从 而 导致 

StartServer 在 等 待 m evtThreadLanched 事件 触发 时 超时 ， 并 进一步 导致 

m evtSvrToStop 事件 被 触发 。 

+ 503—510 47, 创建 m_nSvcThreadNum 个 服务 线程 , 同样 如 果 出 错 则 立即 退出 线程 。 
* 512—527 行 ， 创 建 监听 端口 ， 设 置 SO REUSEADDR 选项 为 TRUE， 绑 定 本 地 端 

口 g_pSvrOptions->m_nServerPort， 并 调用 listen 函数 进行 监听 。 在 此 过 程 中 ， 如 果 

有 错误 发 生 则 直接 结束 ListenThread。 

* 528—529 行 ， 触 发 m_evtThreadLanched 事件 对 象 ， 通 知 StartServer 监听 线程 已 正 

常 启动 。 
€ 530—579 行 ， 循 环 接受 外 来 连接 ， 并 投递 初始 IO 操作 请 求 。 

今 “537 一 541 £T, 接受 外 来 连接 请 求 并 返回 sockAccept (537), 如 果 accept 出 错 (538), 
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那么 触发 事件 对 象 m_evtSvrToStop 并 退出 线程 (539 一 560)， 否 则 进入 下 一 步 。 

> 542~547 行 ， 条 件 编译 代码 ， 如 果 定 义 了 _DEMO ， 那 么 向 主 窗口 发 送 消息 
WM_USER_CLIENT， 消 息 参 数 分 别 是 客户 端 IP 地 址 from.sin addrs addr 和 消息 
子 类 型 CLIENT CONN REQ (客户 端 请 求 连接 )。 

+ 548—554 行 ， 如 果 服 务 器 处 于 暂停 状态 (m bSvrPaused 为 TRUE )， 关 闭 该 客户 端 
的 连接 sockAccept， 然 后 调用 continue 函数 进入 下 一 循环 。 同时， 如 果 定 义 了 
_DEMO， 则 向 主 窗口 发 送 消息 WM_USER_CLIENT， 消 息 参数 是 客户 端 IP 地 址 
from.sin addrs addr 和 消息 子 类 型 CLIENT REJECT (拒绝 客户 端 连接 请 求 )。 

+ 556~562 行 ， 为 该 新 建 连接 (sockAccept) 调用 CreateConnCtx 成 员 函 数 创建 连接 
信息 数据 CIpConnCtx, 在 CreateConnCtx 成 员 函 数 中 还 完成 了 将 sockAccept 与 完成 
端口 m_hIOCP 绑 定 的 工作 )。 在 此 过 程 中 , 如 果 有 错误 发 生 (lpConnCtx 为 NULL), 
那么 触发 事件 对 象 m_evtSvrToStop 并 退出 线程 , 否则 将 IpConnCtx 加 入 到 连接 信息 
链表 中 。 

+ 563~565 行 ， 向 主 窗口 发 送 消息 WM_USER_CLIENT， 消 息 参 数 是 客户 端 全 地 址 
from.sin_addr.s_addr 和 消息 子 类 型 CLIENT ACCEPT (接受 客户 端 连 接 请 求 )。 

* 567~578 行 ， 调 用 WSARecv 函数 在 套 接口 sockAccept 上 投递 初始 的 读 操作 请 求 。 
如 果 WSARecv 返回 非 ERROR_IO_PENDING 错误 ,那么 关闭 连接 并 删除 连接 信息 ， 
然后 进入 下 一 循环 。 

C) “582 一 700 行 ，ServiceThread， 服 务 线程 函数 。 

信 585 行 ， 获 取 CHttpServer 类 实例 的 指针 。 

+ 594—698 行 ， 服 务 循环 ， 获 取 IO 完成 信息 包 ， 根据 IO 类 型 和 数据 ， 组 装 、 解 析 
客户 端的 HTTP-Request， 或 者 发 送 服务 器 Response. 

* 595 行 ， 调 用 GetQueuedCompletionStatus 函数 (返回 值 为 bSuccess) 获取 IO 完成 
信息 包 。 

+ 596—597 fT, 如 果 1pConnCtx X NULL, 说 明 线 程 收 到 了 完成 键 为 NULL 的 特殊 完 
成 信息 包 ， 服 务 线程 终止 。 

+ 598~602 行 ， 如 果 bSuccess 为 FALSE 或 者 bSuccess 为 TRUE， 但 是 IO 数据 量 
dwIOSize 为 0, 那么 说 明 发 生 了 错误 或 者 客户 端 断 开 了 连接 , 服务 线程 将 IpConnCtx 
从 连接 信息 链表 中 删除 ， 并 直接 进入 下 一 个 循环 。 

+ 603~697 行 ， 根 据 完成 信息 包 中 的 LO 类 型 IpPerIOData->oper， 分 两 种 情况 进行 
处 理 : 

今 “604 一 649 行 ，SVR_IO_WRITE， 说 明 服 务 器 完成 的 是 写 操作 〈WSASend)， 也 就 是 
进行 了 Response。 

@ 605 行 ， 累 加 ， 计 算 服 务 器 对 客户 端的 当前 HTTP-Request 的 Response 一 共 已 发 送 
了 多 少数 据 lpConnCtx->nAlreadyResponsed。 按 该 值 与 Response 长 度 的 大 小 关系 ， 
分 @@、@ 两 种 情况 处 理 。 

@ 606 一 632 行 ， 已 经 发 送 数据 量 等 于 Response 的 长 度 ， 说 明 Response 完毕 。 下 一 步 
同样 分 两 种 情况 进行 处 理 : 

O 607~6104F, IpConnCtx->bKeepAlive 为 FALSE， 说 明 不 需要 进行 连接 保持 ， 服 务 
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器 关闭 连接 并 将 连接 信息 从 连接 链表 中 删除 。 

O 611—631 行 ， lpConnCtx->bKeepAlive 7j TRUE， 说 明 需 要 进行 连接 保持 ， 在 复位 
并 设置 相关 参数 和 缓冲 区 后 ， 服 务 器 投递 读 操作 请 求 。 

图 633~648 行 ， 已 经 发 送 数据 量 小 于 Response 的 长 度 ， 说 明 Response 未 结束 ， 正 确 
设置 缓冲 区 偏 移 量 后 ， 服 务 器 继续 发 送 数 据 。 

今 “650 一 694 行 ，SVR_IO_ READ， 说 明 服务 器 完成 的 是 读 操作 〈WSARecv)， 也 就 是 
读 取 了 Request。 

(D 651—655 行 , 将 新 读 取 的 数据 添加 到 连接 信息 IpConnCtx 中 的 客户 端 HTTP 请 求 组 
冲 区 szRequest 中 。 如 果 此 时 的 szRequest 长 度 大 于 最 长 HITP 请 求 长 度 值 
MAX HTTP REQUEST _ LEN， 就 认为 该 数据 有 问题 ， 服 务 器 关闭 对 应 的 客户 端 连 
接 并 从 连接 链表 中 将 其 删除 。 

@ 656—693 行 ， 调 用 IsRequestCompleted 成 员 函 数 ， 检 查 接 收 到 的 HTTP-Request 是 否 
已 完整 ， 按 IsRequestCompleted 的 返回 值 分 两 种 情况 处 理 : 

O 657—676 行 ，TRUE， 说 明 服务 器 已 接收 到 完整 的 HTTP 请 求 。 调 用 ProcessRequest 
成 员 函 数 处 理 IpConnCtx->szRequest， 并 获得 输出 lpConnCtx->szResponse 和 
lpConnCtx->bKeepAlive 后 ， 发 送 lpConnCtx->szResponse。 

O 677~693 行 ，FALSE， 说 明 服务 器 未 接收 完毕 HTTP 请 求 ， 继 续 接收 请 求 数据 。 


22.2.5 CMyWebServerDlg 类 


CMyWebServerDlg 是 最 后 一 个 较为 重要 的 类 ， 该 类 由 系统 自动 生成 ， 对 应 于 MyWeb 的 
主 对 话 框 ， 如 图 22.9 所 示 。 基 本 上 所 有 的 操作 都 围绕 系统 消息 或 者 用 户 消息 进行 ， 所 有 的 函 
数 都 是 消息 处 理 函 数 。 


图 22.9 MyWeb 主 对 话 框 的 设计 
下 面 首先 看 看 该 类 的 接口 声明 : 


HH P P P P P n HL P B P P UP HH HH M HI I n n n n nl 
// MyWebServerDlg.h: CMyWebServerDlg 类 的 接口 声明 
// Create: 2004-03-23 LastModify: 2004-04-05 
HlMMWUIPM LIH M M M P PM P M P P P P P nbn n n PL MH HH ng 
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wonna Q 


#ifndef (AFX MYWEBSERVERDLG H 30C0629F 292F 4206 9934 773E43D351C7 INCLUD 
ED ) 
#define AFX MYWEBSERVERDLG H 30C0629F 292F 4206 9934 773E43D351C7 INCLUDED 


#include "Options.h" // Added by ClassView 
#include "MyNotifyIcon.h" // Added by ClassView 
#if MSC VER > 1000 

#pragma once 

#endif // MSC VER > 1000 


#define WM USER SHOWWND WM USERH100 
didefine WM USER NOTIFYICON WM USERH101 
#define TRAY ICON ID 1234 


Hl I B l LM | P 9 AAA AAA AAA VUL M «ntng 
// CMyWebServerDlg dialog 


class CMyWebServerDlg : public CDialog 
i 


// Construction 


public: 
void AppendSvrInfo (const char *strNewInfo); 
CMyWebServerDlg(CWnd* pParent = NULL); // standard constructor 


// Dialog Data 
//((AFX DATA (CMyWebServerDlg) 
enum { IDD = IDD MYWEBSERVER DIALOG ]; 
CString m strServerInfo; 
// ) JAFX DATA 


// ClassWizard generated virtual function overrides 

//((AFX VIRTUAL (CMyWebServerDlg) 

protected: 

virtual void DoDataExchange (CDataExchange* pDX); // DDX/DDV support 
//) JAFX. VIRTUAL 


// Implementation 

protected: 
CMyNotifyIcon *m pNotifyIcon; 
void UpdateMenuState () ; 
HICON m hIcon; 


void PopMenu(WPARAM wParam, LPARAM lParam); 

// Generated message map functions 

//((AFX MSG (CMyWebServerDlg) 

virtual BOOL OnInitDialog(); 

afx msg void OnSysCommand(UINT nID, LPARAM lParam); 
afx msg void OnPaint(); 
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40 afx msg HCURSOR OnQueryDragIcon(); 

41 afx msg void OnHlpAbout () ; 

42 afx msg void OnOptSetup(); 

43 afx msg void OnOptDefault (); 

44 afx msg BOOL OnSvrStart (); 

45 afx msg BOOL OnSvrPause|(); 

46 afx msg BOOL OnSvrStop(); 

47 afx msg void OnSvrExit (); 

48 afx msg void OnClose(); 

49 afx msg void OnShowWnd(); 

50 afx msg void OnClientMsg (WPARAM wParam, LPARAM lParam); 
5L afx msg LRESULT OnNotifyMsg (WPARAM wParam, LPARAM lParam); 
52 //) )AFX MSG 

53 DECLARE MESSAGE MAP() 

54 y; 


55 //{{AFX_INSERT_LOCATION} } 
56 // Microsoft Visual C++ will insert additional declarations immediately before 
the previous line. 


57 #endif 
A 


在 上 面 的 源码 中 ， 黑体 部 分 由 用 户 手动 编写 ， 其余 代 码 基 本 上 都 由 系统 根据 用 户 定义 的 
消息 -函数 对 应 关系 自动 添加 。 

第 8 一 9 行 定义 了 两 个 用 户 自 定义 消息 常量 。 

第 10 行 定义 了 任务 栏 图 标的 ID。 

第 17 行 AppendSvrInfo，public 成 员 函 数 ， 用 于 向 主 对 话 框 的 服务 器 信息 框 ( 对 话 框 的 
中 间 部 分 ) 输出 信息 。 见 下 面 对 m_strServerInfo 成 员 变 量 的 解释 。 

第 22 47 m_strServerInfo, CString 型 的 public 成 员 变 量 ， 对 应 于 EDIT f£ IDC_EDIT， 如 
22.9 所 示 。 

第 31 行 声 明了 CMyNotifyIcon 类 指针 m_pNotifyIcon。 

下 面 给 出 CMyWebServerDlg 中 各 个 成 员 消息 函数 与 用 户 / 系 统 消息 的 对 应 关系 ， 如 表 
22.1 所 示 。 


表 22.1 消息 与 消息 处 理 函 数 


dü — 3 
响应 菜单 消息 ， 启 动 MyWeb 服务 器 
响应 菜单 消息 ， 暂 停 MyWeb 服务 器 
响应 菜单 消息 ， 停 止 MyWeb 服务 器 


函数 名 称 
OnSvrStart — | ID MENUITEM SVR START 
OnSvrPause | ID MENUITEM SVR PAUSE 
OnSvrStop | ID MENUITEM SVR STOP 
OnSvrExit | ID MENUITEM SVR EXIT 响应 菜单 消息 ， 退 出 MyWeb 服务 器 
OnOptSetup | ID MENUITEM OPT SETUP 响应 菜单 消息 ， 进 行 服务 器 选项 配置 
OnOptDefaul | ID MENUITEM OPT DEFAULT | 响应 菜单 消息 ， 将 服务 器 选项 设置 复位 
t 
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OnHlpAbout 响应 菜单 消息 ， 显 示 About 对 话 框 


函数 名 称 


消息 ID jo xk 


OnNotifyMsg | WM USER NOTIFYICON 


响应 用 户 自 定义 消息 ， 处 理 任务 栏 图 标的 鼠标 事件 


OnShowWnd | WM_USER_SHOWWND 


响应 任务 栏 图 标 弹 出 菜单 中 < 显示 主 窗口 > 选项 消息 ， 
显示 主 对 话 框 


OnClientMsg 


WM_USER_CLIENT 


响应 用 户 自 定义 消息 ， 处 理 CHttpServer 发 送 的 服务 
器 相关 的 消息 


下 面 是 CMyWebServerDlg 类 的 实现 代码 ， 同 样 ， 黑 体 部 分 表示 由 用 户 输入 的 重要 代码 ， 
其 他 为 系统 自动 生成 。 


Hl I P P P P P P P P P M P PH HM M P M GC MIU HH HH HH Hn gg gg 
// MyWebServerDlg.cpp: CMyWebServerD1g 类 的 实现 
// Create: 2004-03-23  LastModify: 2004-04-05 
HI HH TTT TATA P PP HH HM HH M P |n B llli 


1 


YAO s Qm» 


o o0 


#include 
#include 
#include 
#include 
#include 
#include 
#include 


"stdafx.h" 
"MyWebServer.h" 
"MyWebServerDlg.h" 
"Options.h" 
"OptSetupDlg.h" 
"HttpServer.h" 
"MyNotifyIcon.h" 


#ifdef DEBUG 
#define new DEBUG NEW 

*undef THIS FILE 

static char THIS FILE[] = _ FILE ; 


#endif 


HU M MM MM P TATA M P PP P PH TATA Ó n ng gngllt 
// CBboutDlg dialog used for App About 


class CAboutDlg : public CDialog 


{ 
public: 


CAboutDlg(); 


// Dialog Data 
//((AFX DATA (CAboutDlg) 
enum ( IDD = IDD ABOUTBOX }; 
//) )AFX DATA 


// ClassWizard generated virtual function overrides 
//A(AEX. VIRTUAL (CAboutDlg) 
protected: 


26 
27 


28 
29 
30 
31 
32 
33 


34 
35 
36 
37 
38 


39 
40 
41 
42 
43 
44 


45 
46 
47 
48 
49 


50 
51 


52 
53 
54 
55 
56 
57 
58 
59 
60 


61 


2 


63 
64 
65 
66 
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virtual void DoDataExchange (CDataExchange* pDX); // DDX/DDV support 
//}}REX_VIRTUAL 


// Implementation 
protected: 


H 


// (4AFX. MSG (CAboutD1g) 
//))AFX MSG 
DECLARE MESSAGE MAP () 


CAboutDlg::CAboutDlg() : CDialog(CAboutDlg::IDD) 


t 


) 


//((AFX DATA INIT (CAboutDlg) 
//}}AFX_DATA INIT 


void CAboutDlg: :DoDataExchange (CDataExchange* pDX) 


t 


CDialog: : DoDataExchange (pDX) ; 
//((AFX DATA MAP (CAboutDlg) 
//))AFX DATA MAP 


BEGIN MESSAGE MAP(CAboutDlg, CDialog) 


//{{AEX_MSG_MAP (CAboutDlg) 
// No message handlers 
//) )AFX MSG MAP 


END MESSAGE MAP() 


HMM TTT ALTA  L P |» n G G MAulH HW gn 
// CMyWebServerDlg dialog 


CMyWebServerDlg::CMyWebServerDlg(CWnd* pParent /*-NULL*/) 


{ 


: CDialog(CMyWebServerDlg::IDD, pParent) 


//{{BEX_DATA_INIT (CMyWebServerD1g) 

m strServerInfo = T(""); 

//) )AFX DATA INIT 

// Note that LoadIcon does not require a subsequent DestroyIcon in Win32 
m hlIcon = AfxGetApp()-»LoadIcon(IDR MAINFRAME); 


void CMyWebServerDlg: :DoDataExchange (CDataExchange* pDX) 


t 


CDialog: :DoDataExchange (pDX) ; 

//((AFX DATA MAP (CMyWebServerDlg) 

DDX Text(pDX, IDC EDIT, m strServerInfo); 
//))AFX DATA MAP 
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100 
101 
102 
103 
104 
105 


106 
107 
108 
109 


BEGIN MESSAGE MAP (CMyWebServerDlg, CDialog) 


//((AFX MSG MAP (CMyWebServerDlg) 

ON WM SYSCOMMAND () 

ON WM PAINT() 

ON WM QUERYDRAGICON () 

ON COMMAND(ID MENUITEM HLP ABOUT, OnHlpAbout) 
ON COMMAND(ID MENUITEM OPT SETUP, OnOptSetup) 
ON COMMAND(ID MENUITEM OPT DEFAULT, OnOptDefault) 
ON COMMAND(ID MENUITEM SVR START, OnSvrStart) 
ON COMMAND(ID MENUITEM SVR PAUSE, OnSvrPause) 
ON COMMAND(ID MENUITEM SVR STOP, OnSvrStop) 
ON COMMAND(ID MENUITEM SVR EXIT, OnSvrExit) 
ON WM CLOSE () 

ON COMMAND(WM USER SHOWWND, OnShowWnd) 

ON MESSAGE(WM USER CLIENT, OnClientMsg) 

ON MESSAGE(WM USER NOTIFYICON, OnNotifyMsg) 
//) )AFX MSG MAP 


END MESSAGE MAP() 


HUMUM TTT TATA AAT AAT | AAT B BP LH HH UL M n g ng gn 
// CMyWebServerDlg message handlers 


BOOL CMyWebServerDlg: :OnInitDialog() 


{ 


CDialog: :OnInitDialog(); 

// Add "About..." menu item to system menu. 

// IDM_ABOUTBOX must be in the system command range. 
ASSERT ( (IDM ABOUTBOX & OxFFFO) == IDM ABOUTBOX) ; 
ASSERT (IDM_ABOUTBOX < OxF000); 


CMenu* pSysMenu = GetSystemMenu (FALSE) ; 
if (pSysMenu != NULL) 
{ 
CString strAboutMenu; 
strAboutMenu. LoadString (IDS_ABOUTBOX) ; 
if (!strAboutMenu. IsEmpty ()) 
{ 
pSysMenu->AppendMenu (MF_SEPARATOR) ; 
pSysMenu->AppendMenu (MF_STRING, IDM ABOUTBOX, strAboutMenu) ; 


// Set the icon for this dialog. The framework does this automatically 
// when the application's main window is not a dialog 

SetIcon(m_hIcon, TRUE); // Set big icon 

SetIcon(m_hIcon, FALSE); // Set small icon 
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110 

111 // TODO: Add extra initialization here 

112 UpdateMenuState () ; 

113 m pNotifyIcon = new CMyNotifyIcon(m hWnd, WM USER NOTIFYICON, TRAY 
_ICON_ID) ; 

114 m pNotifyIcon-»AddIcon(IDI ICON STOP, "STOP") ; 

115 

116 return TRUE; // return TRUE unless you set the focus to a control 

117 } 


118 void CMyWebServerDlg::OnSysCommand(UINT nID, LPARAM lParam) 
T9 of 


120 if ((nID & OxFFFO) == IDM ABOUTBOX) 
121 { 

122 CAboutDlg dlgAbout; 

123 d1gAbout . DoModal () ; 

124 } 

125 else 

126 if((nID & OxFFFO) — SC MINIMIZE) 
127 ShowWindow(SW HIDE); 

128 else 

129 CDialog::OnSysCommand(nID, lParam); 
130 ] 


131 // If you add a minimize button to your dialog, you will need the code below 
132 // to draw the icon. For MFC applications using the document/view model, 
133 // this is automatically done for you by the framework. 


134 void CMyWebServerDlg::OnPaint () 


135 4 

136 if (IsIconic()) 

137 { 

138 CPaintDC dc(this); // device context for painting 
139 SendMessage(WM ICONERASEBKGND, (WPARAM) dc.GetSafeHdc(), 0); 
140 // Center icon in client rectangle 

141 int cxIcon = GetSystemMetrics (SM CXICON); 

142 int cyIcon - GetSystemMetrics (SM CYICON); 

143 CRect rect; 

144 GetClientRect (&rect); 

145 int x = (rect.Width() - cxIcon + 1) / 2; 

146 int y = (rect.Height() - cyIcon + 1) / 2; 

147 // Draw the icon 

148 dc.DrawIcon(x, y, m hlIcon); 

149 ? 

150 else 


151 { 
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152 CDialog: :OnPaint(); 


155 // The system calls this to obtain the cursor to display while the user drags 
156 // the minimized window. 

157 HCURSOR CMyWebServerDlg: :OnQueryDragIcon () 

158 ( 

159 return (HCURSOR) m hIcon; 


161 void CMyWebServerDlg: :OnHlpAbout () 


162 ( 

163 // TODO: Add your command handler code here 
164 CAboutDlg dlg; 

165 dlg.DoModal(); 

166 ] 


167 void CMyWebServerDlg: :OnOptSetup () 


168 ( 

169 // TODO: Add your command handler code here 

170 COptSetupDlg dlg; 

171 if(dlg.DoModal() == IDOK) { 

172 if (g_pHttpServer->GetServerState() 一 SERVER_RUNNING) { 

173 if (MessageBox (" 是 否 重新 启动 服务 器 ?" ，" 重 启 服务 器 确认 "，MB_ICONQUESTION 
| MB YESNO) 一 IDYES) { 

174 OnSvrStop(); 

175 OnSvrStart(); 

176 ) 

177 ) 

178 } 

179. 3 


180 void CMyWebServerDlg: :OnOptDefault () 

181 ( 

182 // TODO: Add your command handler code here 

183 if (MessageBox (" 如 果 选 择 复 位 ， 您 所 作 的 服务 器 选项 设置 都 将 丢失 ， 是 否 确 认 ?" ，" 服 务 器 选 
项 复位 确认 "，MB_ICONQUESTION | MB YESNO) 一 IDYES) { 


184 g pSvrOptions-»LoadDefOptions () ; 

185 if(g pHttpServer-»GetServerState() 一 SERVER_RUNNING) { 

186 if (MessageBox (" 是 否 重新 启动 服务 器 ?" ，" 重 启 服务 器 确认 "，MB_ICONQUESTION 
| MB YESNO) 一 IDYES) { 

187 OnSvrStop(); 

188 OnSvrStart(); 

189 } 

190 } 

191 } 
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BOOL CMyWebServerDlg: :OnSvrStart () 


{ 


// TODO: Add your command handler code here 
if(!g_pHttpServer->StartServer () ) { 
AppendSvr Info ("MyWeb 启动 服务 失败 ,请 稍 后 重 试 ") ; 
return FALSE; 
} 
UpdateMenuState () ; 


UpdateData () ; 
CString info; 
info.Format ("MyWeb 服务 已 启动 . 端口 : sd AR: ts RAR: zs", 
g pSvrOptions-»m nServerPort, 
g pSvrOptions-»m szHomeDir, 
g pSvrOptions-»m szDefaultPage 
) 7 
AppendSvrInfo (info); 
m pNotifyIcon-»ChangeIcon(IDI ICON RUNNING, "Running"); 
return TRUE; 


BOOL CMyWebServerDlg: :OnSvrPause () 


( 


// TODO: Add your command handler code here 

if(!g_pHttpServer->PauseServer () ) { 
AppendSvrInfo ("MyWeb 暂停 服务 失败 ,请 稍 后 重 试 ") ; 
return FALSE; 

} 

UpdateMenuState () ; 

AppendSvrInfo ("MyWeb 暂停 服务 ") ; 

m pNotifyIcon-»ChangeIcon(IDI ICON PAUSE, "Pause") ; 


return TRUE; 


BOOL CMyWebServerDlg::OnSvrStop() 


B 


// TODO: Add your command handler code here 

if(!g pHttpServer-»StopServer ())í 
AppendSvrInfo ("MyWeb 停止 服务 失败 ， 请 稍 后 重 试 ") ; 
return FALSE; 

} 

UpdateMenuState () ; 

AppendSvrInfo ("MyWeb 停止 服务 ") ; 

m pNotifyIcon-»ChangeIcon(IDI ICON STOP, "Stop") ; 
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237 return TRUE; 
238 } 


239 void CMyWebServerDlg: :OnSvrExit () 


240 ( 

241 // TODO: Add your command handler code here 

242 if(g pHttpServer-»GetServerState() != SERVER STOP)( 

243 if MessageBox ("服务 器 运行 中 ， 是 否 确认 退出 ?2"，" 退 出 确认 "，MB_ICONQUESTION | 
MB YESNO) 一 IDNO) 

244 return; 

245 } 

246 OnSvrStop () ; 

247 m_pNotifyIcon->DelIcon () ; 

248 delete m_pNotifyIcon; 

249 CDialog: :OnCancel () ; 

250 } 


251 void CMyWebServerDlg: :OnClose () 


252 { 

253 // TODO: Add your message handler code here and/or call default 
254 OnSvrExit(); 

255 } 


256 void CMyWebServerDlg: :UpdateMenuState () 


257 ( 

258 ServerState state = g pHttpServer-»GetServerState(); 

259 CMenu *pMenu = GetMenu(); 

260 ASSERT (pMenu != NULL); 

261 switch (state) { 

262 case SERVER_STOP: 

263 pMenu->EnableMenuItem (ID MENUITEM SVR START, MF ENABLED); 

264 pMenu-»EnableMenuItem(ID MENUITEM SVR PAUSE, MF DISABLED | MF_GRAYED) ; 
265 pMenu->EnableMenuItem (ID MENUITEM SVR STOP, MF DISABLED | MF GRAYED) ; 
266 break; 

267 case SERVER_PAUSE: 

268 pMenu->EnableMenuItem(ID_MENUITEM SVR START, MF ENABLED); 

269 pMenu-^EnableMenuItem(ID MENUITEM SVR PAUSE, MF DISABLED | MF GRAYED); 
270 pMenu-^EnableMenuItem(ID MENUITEM SVR STOP, MF ENABLED); 

271 break; 

272 Case SERVER RUNNING: 

273 pMenu-^EnableMenuItem(ID MENUITEM SVR START, MF DISABLED | MF_GRAYED) ; 
274 pMenu-^EnableMenuItem(ID MENUITEM SVR PAUSE, MF ENABLED); 


275 PpMenu->EnableMenuItem(ID MENUITEM SVR STOP, MF ENABLED); 
276 break; 


277 
278 } 
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279 void CMyWebServerDlg: :AppendSvrInfo (const char *strNewInfo) 


280 { 
281 
282 
283 
284 
285 
286 
287 


288 
289 } 


time t ts; 

struct tm *local; 

time(&ts); 

local = localtime (sts); 

CString tmp; 

tmp.Format("£s: %s\r\n", asctime(local), strNewInfo); 
m strServerInfo 4— tmp; 


UpdateData (FALSE) ; 


290 void CMyWebServerDlg::OnClientMsg (WPARAM wParam, LPARAM lParam) 


291 ( 
292 
293 
294 


295 
296 
297 
298 } 


IN ADDR client; 

client.s addr = wParam; 

char* ClientMsg[] = {" 请 求 连接 " ，" 连 接 被 接受 " ，" 连 接 被 拒绝 " ，" 连 接 关闭 " ，" 发 生 错 
误 ， 连 接 结束 "} ; 

Cstring info; 

info.Format("From IP 地 址 2s, %s", inet ntoa(client), ClientMsg[lParam]); 

AppendSvrInfo(info.operator LPCTSTR()); 


299 void CMyWebServerDlg: :OnShowWnd () 


300 ( 
301 
302 } 


ShowWindow(SW SHOW); 


303 LRESULT CMyWebServerDlg::OnNotifyMsg (WPARAM wParam, LPARAM lParam) 


304 ( 
305 
306 
307 
308 
309 
310 
311 
312 
313 
314 
315 
316 
317 } 


switch (lParam) { 

case WM LBUTTONDBLCLK: 
ShowWindow(SW SHOW); 
break; 

case WM RBUTTONDOWN: 
PopMenu(wParam, lParam); 
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318 void CMyWebServerD1g: :PopMenu (WPARAM wParam, LPARAM lParam) 


319 { 
320 
321 
322 
323 
324 
325 
326 
327 
328 
329 


330 
331 
332 
333 
334 
335 
336 
337 
338 
339 
340 
341 
342 
343 
344 
345 


346 


347 
348 


349 
350 


if (wParam — TRAY ICON ID && lParam 一 WM RBUTTONDOWN) 


{ 


CMenu ContextMenu; 

CPoint CursorPos; 

GetCursorPos (&CursorPos); 

ContextMenu .CreatePopupMenu () ; 

ServerState state = g pHttpServer->GetServerState() ; 

ContextMenu.AppendMenu(MF STRING, WM USER SHOWWND, ，_T(" 显 示 主 窗口 ") ) ; 

ContextMenu.SetDefaultItem(0, TRUE); 

ContextMenu.AppendMenu(MF STRING, ID MENUITEM HLP ABOUT, _T(" 关 于 
MyWeb") ) ; 

ContextMenu.AppendMenu(MF STRING, ID MENUITEM OPT SETUP, _T(" RERS 
器 ")) 

ContextMenu .AppendMenu (MF_SEPARATOR) ; 


switch (state) { 
case SERVER_STOP: 
ContextMenu.AppendMenu(MF STRING, ID MENUITEM SVR START, _T(" 启 
Bi MyWeb") ) ; 
ContextMenu.AppendMenu(MF GRAYED, ID MENUITEM SVR PAUSE, _T("#f 
MyWeb") ) ; 
ContextMenu.AppendMenu(MF GRAYED, ID MENUITEM SVR STOP, _T("#ik 
MyWeb") ) ; 
break; 
case SERVER_PAUSE: 
ContextMenu.AppendMenu(MF STRING, ID MENUITEM SVR START, _T(" 启 
B) MyWeb") ) ; 
ContextMenu.AppendMenu(MF GRAYED, ID MENUITEM SVR PAUSE, _T("#f 
Myweb") ) ; 
ContextMenu.AppendMenu(MF STRING, ID MENUITEM SVR STOP, _T("##ik 
MyWeb") ) ; 
break; 
case SERVER_RUNNING: 
ContextMenu.AppendMenu(MF GRAYED, ID MENUITEM SVR START, _T(" 启 
By MyWeb") ) ; 
ContextMenu.AppendMenu(MF STRING, ID MENUITEM SVR PAUSE, _T(" 暂 
停 MyWeb")) ; 
ContextMenu.AppendMenu(MF STRING, ID MENUITEM SVR_STOP，_T(" 停 止 
MyWeb")) ; 
break; 


ContextMenu .AppendMenu (MF SEPARATOR) ; 
ContextMenu.AppendMenu(MF STRING, ID MENUITEM SVR EXIT, _T("BH 
MyWeb")) ; 
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351 SetForegroundWindow () ; 

352 ContextMenu.TrackPopupMenu (TPM RIGHTALIGN | TPM RIGHTBUTTON, 
CursorPos.x, CursorPos.y, this, NULL); 

353 } 

354 } 
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第 81—83 行 添加 用 户 自 定 义 消 息 WM. USER SHOWWND, WM USER CLIENT 和 
WM_USER_NOTIFYICON 的 消息 处 理 函数 。 

第 111—114 行进 行 额外 的 对 话 框 初始 工作 , 首先 调用 UpdateMenuState 成 员 函 数 正确 设 
置 主 菜 单 各 菜单 项 的 启用 /禁用 关系 〈 由 服务 器 当前 状态 决定 ) ; 然后 创建 CMyNotifyIcon 类 
的 实例 m_pNotifyIcon， 传 入 的 参数 是 当前 对 话 框 的 句柄 m_hWand， 以 及 用 户 自 定义 消息 
WM USER NOTIFYICON 和 常量 TRAY ICON ID; 最 后 调用 m pNotifyIcon 成 员 函 数 添 加 
任务 栏 图 标 。 

第 126 一 127 行 处 理 主 对 话 框 的 最 小 化 消息 ， 选 择 将 其 隐藏 。 

第 161—166 行 OnHlpAbout，protected 成 员 函 数 ， 消 息 处 理 函 数 ， 显 示 About 对 话 框 。 

第 167—179 行 OnOptSetup，protected 成 员 函 数 ， 消 息 处 理 函 数 ， 显 示 服 务 器 配置 对 话 
框 〈 见 22.2.2 节 ) 。 如 果 对 话 框 关闭 时 返回 DOK (用户 单 击 了 “确定 ”按钮 ) 并 且 服务 器 
当前 处 于 SERVER. RUNNING 运行 状态 ， 那 么 询问 用 户 是 否 需要 重启 服务 器 ， 并 按 用 户 回 
答 进行 相应 操作 。 

第 180 一 194 行 OnOptDefault，protected 成 员 函 数 ， 消 息 处 理 函数 ， 复 位 服务 器 配置 。 

第 195 一 213 行 OnSvrStart，protected 成 员 函 数 ， 消 息 处 理 函数 。 该 函数 完成 了 启动 服务 
器 (调用 全 局 变量 CHttpServer 类 的 实例 g pHttpServer 的 相应 函数 ，198 一 201 行 ) 、 刷 新 主 
菜单 (202 行 ) 、 添 加 服务 器 信息 (203—210 行 ) 以 及 切换 任务 栏 图 标 等 工作 (21147) o 

第 214—226 行 OnSvrPause，protected 成 员 函 数 ， 消 息 处 理 函 数 。 该 函数 完成 了 暂停 服 
务 器 (217~220 行 ) 、 刷 新 主 菜单 C10 行 ) 、 添 加 服务 器 信息 (222 行 ) 以 及 切换 任务 栏 
图 标 等 工作 (223 行 ) 。 

第 227—238 ÍF OnSvrStop, protected 成 员 函 数 ， 消 息 处 理 函 数 。 该 函数 完成 了 停止 服务 
器 (230~233 行 ) 、 刷 新 主 菜单 O34 行 ) 、 添 加 服务 器 信息 〈235 行 ) 以 及 切换 任务 栏 图 
标 等 工作 (236 行 ) 。 

第 239—250 ÍF OnSvrExit, protected 成 员 函 数 ， 消 息 处 理 函 数 。 函 数 首 先 判断 服务 器 当 
前 状态 ， 如 果 处 于 运行 或 者 暂停 状态 ， 则 让 用 户 确认 是 否 停止 服务 。 在 得 到 确认 后 ， 函 数 调 
用 OnSvrStop 函数 停止 服务 器 ;和 否则 直接 返回 。 在 停止 服务 器 后 ， 函 数 删 除 任务 栏 图 标 ， 释 
Ji m pNotifyIcon 所 占 资源 ， 最 后 调用 基 类 CDialog 的 OnCancel 函数 进行 进一步 的 资源 释放 
工作 。 

第 256—278 1T UpdateMenuState, protected 成 员 函 数 ， 根 据 服务 器 的 当前 状态 设 定 主 菜 
单 中 菜单 项 的 启用 /禁用 状态 。 

第 279—289 行 AppendSvrInfo，public 成 员 函 数 ， 将 用 户 信息 stNewInfo 和 当前 时 间 组 
合 起 来 添加 到 成 员 变 量 m_strServerInfo， 然 后 调用 UpdateData 函数 将 其 显示 。 

第 290—298 ÍT OnClientMsg, protected 成 员 函 数 ， 消 息 处 理 函 数 。 函 数 首先 接收 
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CMyHttpServer 模块 传 来 的 服务 器 消息 , 其 中 参数 wParam 是 连接 的 客户 端的 IP 地 址 , Param 
是 消息 的 子 类 型 。 然 后 根据 该 消息 及 消息 参数 组 成 服务 器 信息 ， 并 调用 AppendSvrInfo 成 员 
函数 将 其 显示 。 

第 303—317 行 OnNotifyMsg，protected 成 员 函 数 ， 消 息 处 理 函数 ， 解 析 并 响应 用 户 自 定 
义 的 任务 栏 图 标 消息 。 接 收 的 两 个 消息 参数 wParam 和 lParam 分 别 是 任务 栏 图 标的 ID AR 
标 事件 值 。 如 果 是 左 键 双击 任务 栏 图 标 ， 那 么 显示 服务 器 的 主 对 话 框 〈306 一 308 47) ; 如果 
是 右键 单 击 任务 栏 图 标 ， 则 调用 PopMenu 成 员 函 数 显 示 弹 出 菜单 (309~311 行 ) 。 

第 318—354 fT PopMenu, protected 成 员 函 数 ， 显 示 任 务 栏 图 标的 弹出 式 菜单 。 


22.26 ”其 他 


此 外 , MyWeb 项 目 源码 中 还 包含 了 类 CAboutDlg 和 CMyWebServerApp， 由 于 这 两 个 类 
完全 由 VC 系统 自动 生成 ， 这 里 就 不 再 装 述 。 


22.3 总 结 


本 章 给 出 了 一 个 完整 的 WEB 服务 器 MyWeb 的 源码 ， 结 合 这 些 代码 向 读者 展示 了 如 何 
进行 Winsock 编程 、 如 何 进行 线程 同步 ,以 及 如 何 应 用 完成 端口 模型 进行 复杂 的 TCP 服务 器 
设计 和 实现 。 总 的 来 说 ，MyWeb 服务 器 可 以 作为 大 型 软件 的 WEB 发布 模块 使 用 ， 同 时 ， 由 
于 其 采用 了 高 性 能 的 完成 端口 框架 ， 因 此 也 可 以 扩展 为 独立 的 Win32 平台 下 的 WEB 服 务 
器 。 

当然 MyWeb 项 目 主要 用 作 演 示 ， 在 编程 过 程 中 更 多 考虑 的 是 程序 的 简洁 性 和 可 读 性 ， 
因此 要 成 为 一 个 独立 的 高 性 能 服务 器 ， 要 做 的 改进 还 很 多 ， 例 如 : 采用 启发 式 算法 蔡 代 固定 
的 服务 线程 数 ， 维 持 一 个 打开 文件 的 句柄 链表 以 替代 当前 的 为 每 一 个 资源 请 求 都 进行 文件 打 
开 /关闭 IO 操作 的 处 理 方式 等 ， 这 些 都 是 读者 在 对 MyWeb 进行 改进 时 需要 考虑 的 。 


附录 RFC 


本 附录 对 与 本 书 中 内 容 相关 的 部 分 REC 进行 分 类 , 并 简要 说 明 其 内 容 , 供 读者 进一步 研 
究 相 关 问 题 作 参 考 。 

1. 一 般 内 容 

RFC980 ”协议 文档 顺序 信息 

RFC1009 ”互联 网 网 关 需 求 

RFC1011 ”官方 网 际 协议 

RFC1122 ”互联 网 主机 需求 -通信 层次 

RFC1123 ”互联 网 主机 需求 -应 用 和 支持 

RFC1127 ”主机 需求 RFC 的 前 途 

RFC1173 ”主机 和 网 络 管理 的 责任 : 互联 网 管理 摘要 

RFC1175 “用户 参 考 从 何 处 开始 ， 网 络 信息 参考 书 

RFC1180 TCP/IP 指南 

RFC1206 ”问题 及 回答 FYI: 互联 网 新 手 问 题解 答 

RFC1207 ”问题 及 回答 FYI: 有 经 验 的 互联 网 用 户 问题 解答 

RFCI208 ”网 络 术 语 表 

RFC1251 ”互联 网 历史 : IAB, IESG and IRSG 成 员 传记 

RFC1340 ”分配 端口 

RFC1360 IAB 官方 协议 标准 

2. PĒ 

RFC791 ”网 际 协 议 

RFC792 网际 控制 消息 协议 

RFC814 ”名 字 、 地 址 、 端 口 和 路 由 

RFC815 ”下 数 据 报 从 组 标准 

RFC826 ”地 址 解析 协议 

RFC886 ”消息 头 插入 的 建议 标准 

RFC903 ” 反 向 地 址 解析 协议 

RFC919 ”互联 网 数据 报 广播 

RFC922 ”在 子 网 上 广播 互联 网 数据 报 

RFCO32 子 网 编 址 计划 

RFC950 ” 子 网 划分 过 程 互联 网 标准 

RFC1027 ”使 用 ARP 实现 透明 子 网 网 关 

RFC1088 ”在 NetBIOS 网 络 上 传输 IP 数据 报 的 标准 

RFC1112 ”IP 多 点 播送 的 主机 扩充 
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RFC1219 ME 

3. 路 由 协议 

RFC827 ”外 部 网 关 协 议 (EGP) 

RFC904 ”外 部 网 关 协 议 正规 标准 
RFC1058 ”路 由 信息 协议 

RFC1074 ”基于 SPF 的 NSFNET 上 骨干 网 内 部 网 关 协 议 
RFC1163 ”边界 网 关 协 议 

RFC1164 ”边界 网 关 协 议 在 互联 网 中 的 应 用 
RFC1195 ”使 用 OSIIS-IS 在 TCP/IP 和 双环 境 中 进行 路 由 选择 
RFC1222  NSENET 路 由 体系 结构 扩充 
RFC1245 ”OSPF 协议 分 析 

RFC1246 ”OSPF 协议 使 用 经 验 

RFC1247 OSPF 版 本 2 

RFC1267 ”边界 网 关 协 议 3 

4. 传输 层 

RFC768 ”用户 数据 报 协议 

RFC793 ”传输 控制 协议 

RFC813 TCP 窗口 和 确认 策略 

RFC879 TCP 最 大 段 长 度 及 相关 主题 
RFC896 TCP/IP 网 络 拥塞 控制 

RFC1072 ”长 延迟 路 径 TCP 扩充 


5. 域名 系统 
RFC799 ”互联 网 域名 
RFC920 RER 


RFCO74 ”邮件 路 由 和 域名 系统 

RFC1032 ”域名 管理 员 指南 

RFC1033 ”域名 管理 员 操 作 指 南 

RFC1034 ”域名 一 概念 和 工具 

RFC1035 ”域名 一 实现 和 规范 

RFC1101 ”网 络 名 称 DNS 编码 及 其 他 编码 

6. 邮件 

RFC821 ”简单 邮件 传输 协议 

RFC974 ”邮件 路 由 和 域名 系统 

RFC1056 PCMAIL 个 人 电脑 上 的 分 布 式 邮件 系统 
RFC1341 MIME 〈 多 用 途 互联 网 邮件 扩充 ) 指定 和 描述 互联 网 消息 体 的 格式 的 机 制 
7. 文件 传输 和 文件 访问 

RFC775 ”面向 目录 的 FIP 命令 

RFC783 TFTP 协议 

RFC949 ”FTP 惟一 的 名 字 存 储 命令 


RFC959 ”文件 传输 协议 

RFC1094  NFS: 网 络 文件 系统 协议 规范 

8. 终端 访问 

RFC854 Telnet 协议 规范 

RFC855 Telnet 属性 规范 

RFC856 Telnet 二 进 制 传输 

RFC857 Telnet 应 答 属性 

RFC858 Telnet 压缩 传输 属性 

RFC859 Telnet 状态 属性 

RFC885 Telnet 纪录 结束 属性 

RFC933 ”输出 标记 Telnet 属性 

9. 网 络 管理 

RFC1155 48 TCP/IP 互联 网 络 管理 信息 的 结构 和 标识 
RFC1156 ”基于 TCP/IP 互联 网 络 管理 的 管理 信息 库 
RFC1157 ”简单 网 络 管理 协议 (SNMP) 

RFC1212 ”简明 MIB 定义 

RFC1213  3&T TCP/IP 的 互联 网 络 管理 信息 基 : MIB-II 
RFC1214 OSI 互联 网 管理 : 管理 信息 基 

RFC1215 ”使 用 SNMP 定义 陷阱 的 协定 

10. Ipv6 

RFC1287 ”未 来 的 Internet 体系 结构 

RFC1375 ”对 新 的 IP 地 址 类 别 的 建议 

RFC1454 ”下 一 版 本 了 P 提案 的 比较 

RFC1667  IPng 建 模 和 仿真 需求 

RFC1668  IPng 统一 的 选 路 需求 

RFC1669  IPng 标准 的 市 场 生命 力 

RFC1670 ”对 IPng 工程 考虑 的 输入 

RFC1671 ”向 IPng 过 渡 和 其 他 考虑 的 白皮书 
RFC1675 “对 IPng 安全 性 的 关注 

RFC1683  IPng 中 的 多 协议 互 操作 性 

RFC1726 ”选择 下 一 代 了 下 〈Ipng) 的 技术 准则 
RFC1744 Internet 地 址 空间 管理 的 观察 报告 
RFC1752 ”对 也 下 一 代 协 议 的 建议 

RFC1809  IPv6 中 流标 记 字 段 的 用 法 

RFC1826 IP 身份 验证 头 

RFC1881  IPv6 地 址 分 配 管理 

RFC1883  IPv6 技术 规范 

RFC1884  IPv6 寻 址 体系 结构 

RFC1885 JHF IPv6 的 Internet 控制 报 文 协议 (ICMPv6) 的 技术 规范 
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RFC1924 
RFC2185 
RFC2373 
RFC2374 
RFC2375 


IPv6 地 址 的 一 种 紧凑 的 表示 方法 
向 IPv6 过 渡 的 选 路 问题 

IPv6 寻 址 体系 结构 

IPv6 可 集聚 全 球 单 播 地 址 格式 
IPv6 组 播 地 址 指派 
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